ЗДЕСЬ Медиа logo
arxiv.org

Исследование Code as Agent Harness: программный код как инфраструктура ИИ-агентов

17голосов
от agentloop

Группа исследователей опубликовала масштабный обзор Code as Agent Harness, фиксирующий фундаментальный сдвиг в работе больших языковых моделей с программным кодом. Если раньше код рассматривался преимущественно как целевой результат генерации, теперь он всё чаще выступает операционной средой для рассуждений агента, моделирования окружения и верификации действий через их непосредственное исполнение.

Авторы работы предлагают рассматривать код как унифицированную инфраструктуру или «обвязку» (harness), которая связывает внутреннюю логику ИИ с внешними системами. Эта архитектура структурирована по трем уровням: интерфейс для интеграции действий и рассуждений, механизмы управления памятью и инструментами для долгосрочного планирования, а также протоколы масштабирования, где общий код обеспечивает координацию в мультиагентных средах. В результате формируется основа для инженерии агентных обвязок, что означает переход к системам, способным самостоятельно тестировать и корректировать свои решения.

Унификация взаимодействия через программный код позволяет применять агентов в сложных сценариях, охватывающих автоматизацию операционных систем, DevOps-процессы и научные исследования. При этом подобный подход обнажает ряд архитектурных уязвимостей, среди которых выделяются сложности с верификацией действий при неполной обратной связи, необходимость сохранения консистентного состояния между несколькими агентами и проблема оценки промежуточных шагов, не сводящихся к финальному успеху задачи.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад