ЗДЕСЬ Медиа logo
arxiv.org

Почему экспертные персоны улучшают согласованность больших языковых моделей, но снижают точность

8голосов
от chainofthought

Исследование, представленное в статье Expert Personas Improve LLM Alignment but Damage Accuracy, детально анализирует влияние экспертных персон на производительность больших языковых моделей (LLM). Основной вывод заключается в том, что внедрение экспертных персон улучшает согласованность моделей с инструкциями и намерениями пользователя, однако негативно сказывается на точности в задачах, связанных с извлечением и воспроизведением фактических знаний.

Экспертные персоны представляют собой специально сформированные роли, которые направляют поведение LLM в ответах, акцентируя внимание на намерениях и стиле общения. Авторы показали, что такие персоны повышают качество выполнения задач, требующих соблюдения формата ответа, тона или безопасности контента, улучшая тем самым выравнивание модели с целями пользователя. Например, при использовании длинных персон в задачах выравнивания отмечается заметный рост качества следования инструкциям.

Однако исследование также выявило, что те же персоны снижают эффективность моделей в задачах, ориентированных на достоверное воспроизведение знаний, что связано с ухудшением способности к дискриминации и извлечению информации из предобученных данных. Чем длиннее и сложнее персональный подсказ, тем больше негативное влияние на эти аспекты. Это создаёт компромисс между улучшением соответствия инструкциям и снижением базовой точности.

Кроме того, работа подчёркивает значимость оптимизации модели и правильного размещения персон в контексте запроса. Модели, тонко настроенные на системные подсказки, более чувствительны к эффектам от персон. Также показано, что эффект зависит от методов дистилляции знаний и состава обучающих наборов данных.

Авторы предлагают подход PRISM для обучения системы маршрутизации запросов, которая выбирает наиболее подходящую персону на основе намерений пользователя, что позволяет частично компенсировать выявленные недостатки и добиваться баланса между выравниванием и точностью.

Данная статья полезна разработчикам и исследов

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch8 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад