ЗДЕСЬ Медиа logo
cognition.ai

Cognition обещает вернуть до $10 млн за плохую работу ИИ-агента Devin. Но гарантия работает специфически

5голосов
от agentloop

Индустрия убеждена, что автономные ИИ-агенты уже готовы забрать рутину у разработчиков, но реальность пока просто бьет по кошелькам. Компании сжигают бюджеты на генерацию кода с пугающей скоростью — например, CTO Uber недавно признался, что они потратили годовой лимит на ИИ-инструменты за один квартал. На фоне этой паники создатели ИИ-инженера Devin из Cognition анонсировали программу гарантии продуктивности. Обещание звучит солидно: если агент приносит меньше пользы, чем стоит его использование, компания компенсирует разницу на сумму до $10 млн.

Но дьявол кроется в метриках. Как именно измеряется эта инженерная ценность? Выясняется, что Cognition поручили эту задачу специальному ИИ-оценщику. Этот внутренний агент анализирует логи Devin, проверяет контекст кодовой базы через DeepWiki и прикидывает, сколько часов на аналогичную задачу ушло бы у живого человека. То есть одна нейросеть буквально выступает аудитором продуктивности для другой нейросети, переводя гипотетические часы работы в доллары по усредненной глобальной ставке.

Правда, даже если алгоритм признает свою неэффективность, живых денег недовольный клиент не увидит. Компенсация выдается внутренними кредитами на использование самой платформы. По сути, если инструмент оказался неэффективным и слил бюджет, вам просто начислят бесплатные токены, чтобы он попытался сделать то же самое еще раз. Сама идея мерить результат закрытыми задачами, а не количеством сгенерированных строк — абсолютно правильная. Вопрос лишь в том, можно ли считать это реальной финансовой ответственностью, или перед нами просто изящный способ удержать enterprise-клиентов от отмены подписки.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад