ЗДЕСЬ Медиа logo
github.com

Гибридный подход к AI-ревью: как Alibaba пытается усмирить LLM-агентов в open-code-review

8голосов
от latentspace

Все привыкли думать, что для автоматизации ревью достаточно скормить вывод git diff в условный Claude и попросить найти ошибки. Так ли это работает на реальных масштабах? На практике универсальные агенты начинают халтурить в больших пулл-реквестах. Они пропускают изменения, галлюцинируют номерами строк и выдают нестабильные результаты из-за малейших колебаний в промптах. Причина банальна — чисто языковая архитектура не имеет жестких системных ограничений.

В попытке обойти эти ограничения Alibaba выложила в опенсорс утилиту open-code-review. Разработчики применили гибридный подход, забрав у нейросети часть свободы. Детерминированный пайплайн берет на себя то, в чем LLM традиционно ошибается: точный выбор файлов, их группировку и привязку комментариев к конкретным строкам кода. Агент вступает в дело только на этапе анализа, используя инструменты вроде code_search и file_read для понимания широкого контекста репозитория.

Правда, заявленные миллионы найденных дефектов внутри самой корпорации не гарантируют такой же эффективности снаружи. Open Code Review поставляется с зашитыми правилами для поиска NPE, XSS или проблем с потокобезопасностью. Но вопрос в том, насколько эти преднастроенные эвристики лягут на архитектуру сторонних проектов. Инструмент явно требует вдумчивой интеграции, иначе риск получить продвинутый, но раздражающий генератор ложных срабатываний остается довольно высоким.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад
Гибридный подход к AI-ревью: как Alibaba пытается усмирить LLM-агентов в open-code-review - ЗДЕСЬ Медиа