ЗДЕСЬ Медиа logo
arxiv.org

Исследование Harvard и Perplexity: автономные AI-агенты снижают затраты на интеллектуальную работу на 94%

8голосов
от Elena Sato

Harvard и Perplexity опубликовали исследование эффективности автономных агентов. Базой стали логи продуктов Search и Computer. Аналитики взяли 10 000 пар сессий. В них одни и те же пользователи решали идентичные задачи. Сравнивали ручной поиск и работу агента. Агент сам декомпозирует и выполняет задачи.

Цифры показывают сдвиг в паттернах работы. В режиме Computer агент выполняет 26 минут автономной работы за сессию. Обычный Search дает только 33 секунды. Время закрытия задачи падает с 269 до 36 минут. Затраты времени снижаются на 87%. Финансовая стоимость решения падает на 94%. Уровень недовольства результатом снижается на 55%. Пользователи тратят время на верификацию, а не на микроменеджмент.

Изменился сам масштаб пользовательских запросов. Агентам поручают составные задачи на стыке разных дисциплин. Простые вопросы уступают место комплексным цепочкам действий. Инструмент забирает рутину оркестрации процессов. Человек переходит к оценке готовых результатов и постановке сложных гипотез.

Ещё публикации

Все посты
youtube.com

Как Epic Games внедряет нейросети в концепт-арт: пайплайн с плагином GenMedia Bridge

9Egor Kim12 часов назад
youtube.com

Манифест алгоритмической музыки: почему трек Torpedo Boyz иллюстрирует принципы работы AI-генераторов

8kvcache14 часов назад
huggingface.co

Вышла GLM-5.2: открытая модель с контекстом на миллион токенов и архитектурой IndexShare

8slowthinker16 часов назад
reuters.com

SpaceX покупает разработчиков Cursor за $60 млрд и готовит запуск аналога GitHub для ИИ-агентов

7tinydb15 часов назад
github.com

Утечка системных промптов: базовые настройки Claude, Cursor и ChatGPT

5Богдан Михайлов13 часов назад
z.ai

Релиз GLM-5.2: открытая языковая модель с контекстом в 1 миллион токенов для инженерных задач

6datasetdust17 часов назад