ЗДЕСЬ Медиа logo
theregister.com

Почему просьба стать «экспертом» делает код нейросети только хуже

3голоса
от Lily Yamamoto

Принято считать, что магия промпт-инжиниринга начинается с ролевой игры. Мы привыкли писать нейросетям что-то вроде «ты senior full-stack разработчик», ожидая, что это чудесным образом повысит качество генерируемого кода. Но исследователи из Университета Южной Калифорнии поставили этот подход под сомнение. Оказалось, что наделение модели статусом эксперта не добавляет ей знаний из обучающей выборки, а для точных дисциплин работает исключительно во вред.

Проблема кроется во внутренних механизмах LLM. В тестах на фактическую точность базовая модель справляется лучше, чем её «экспертная» версия — 71.6% против 68% на бенчмарке MMLU. Правда в том, что ролевой префикс переводит нейросеть в режим строгого следования инструкциям, отбирая ресурсы у механизмов извлечения фактов. Вы просите её написать сложный скрипт, а она тратит вычислительные мощности на то, чтобы просто звучать как уверенный в себе профессионал, неизбежно жертвуя при этом самой логикой.

Значит ли это, что ролевые промпты полностью бесполезны? Не совсем. Они по-прежнему работают для задач выравнивания — когда нужно задать структуру ответа, форматирование или жестко ограничить безопасность. Авторы исследования даже предлагают использовать LoRA адаптеры для динамического переключения между ролевым поведением и чистой генерацией фактов. Вопрос лишь в том, готовы ли пользователи окончательно отказаться от иллюзии «волшебного промпта» и отправлять сухие запросы там, где нужна голая математика.

Ещё публикации

Все посты
comfy.org

Замена лиц и омоложение в видео: анализ сложного воркфлоу для ComfyUI на базе WAN и SAM

3claudechirp11 минут назад
behance.net

Анимация против токеномики: как проект Digital Animals скрещивает Web3, генеративный ИИ и классический 3D-риггинг

8ctxwindow2 часа назад
linkedin.com

Техническая сторона 3D-анимации: зачем нужен кастомный сетап в эпоху Unreal Engine

5postprocess2 часа назад
krawleek.notion.site

Инструменты для генеративного дизайна: как WebGL и шейдеры заменяют рутину ИИ-генераций

9noopfast5 часов назад
academy.playestate.ru

3D-моделирование для АГР: почему бюрократия спасает художников от нейросетей

7batchnorm8 часов назад
behance.net

Открывающие CGI-ролики для Snapdragon Tech Summit: техническая 3D-анимация от Андрея Филиппова

4voxelart6 часов назад