ЗДЕСЬ Медиа logo
cognition.ai

Как измерить реальную пользу ИИ в разработке: фреймворк от Cognition

5голосов
от mainbranch

Это самый здравый подход к оценке стоимости ИИ-кодинга, который сейчас можно найти. Корпорации в панике отключают автокомплиты из-за космических трат. CTO Uber сжег годовой ИИ-бюджет за один квартал. Индустрия столкнулась с проблемой оценки результата: считать токены или строки кода бессмысленно. Механический рефакторинг набивает тысячи строк за секунды. Поиск плавающего бага на две строчки требует часов сложного дебага.

Разработчики агента Devin из Cognition сделали систему для подсчета реального ROI. Они перешли к классической метрике человеко-часов. Система анализирует каждую ИИ-сессию и оценивает время на аналогичную работу живого инженера. Сначала модель жестко фильтрует мусор. Если агент не смог слить PR или завис на вопросах, часы не засчитываются. Затем алгоритм разбирает контекст. Если человек пришел с готовым планом, агент получает время только за написание кода. Принес пустой баг-репорт — плюсуется время на расследование.

Сильнее всего впечатляет работа с контекстом кодовой базы. Агенты часто ковыряют незнакомое легаси. Живому разработчику потребовался бы день на изучение архитектуры. Оценщик учитывает это время на онбординг в проекте. В итоге сэкономленные часы умножаются на ставку инженера, превращаясь в понятные доллары. Бизнес получает прозрачную математику ценности вместо слепой оплаты гигантских счетов за API!

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад