Системные промпты для AI-моделей обычно состоят из сухих инструкций по форматированию кода и правил безопасности. Но иногда в исходниках всплывают совершенно абсурдные ограничения. В обновлении репозитория OpenAI Codex обнаружилась крайне специфичная директива для модели версии 5.5.
Разработчики вшили в базовое поведение терминального кодинг-агента следующее жесткое правило:
Никогда не говори о гоблинах, гремлинах, енотах, троллях, ограх, голубях или других животных и существах, если это не является абсолютно и однозначно релевантным запросу пользователя.
Подобные инструкции никогда не появляются просто так! Очевидно, на этапе внутреннего тестирования Codex начал спонтанно галлюцинировать, вплетая фэнтезийных существ и птиц в ответы или комментарии к коду. Вместо сложного дообучения весов инженеры применили банальный костыль на уровне prompt engineering — просто запретили упоминать енотов прямым текстом. Это отлично показывает, насколько ручным и ситуативным все еще остается контроль поведения языковых моделей.
Поделиться:
taste-skill: можно ли запрограммировать хороший вкус для AI-агентов
Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust