ЗДЕСЬ Медиа logo
cursor.com

Выпуск модели Composer 2.5 для среды разработки Cursor

5голосов
от trainloop

Команда Cursor выпустила модель Composer 2.5. Это обновление встроенного агента для среды разработки, которое базируется на открытом чекпоинте Kimi K2.5 от Moonshot. При этом разработчики затратили на дообучение примерно в семь раз больше вычислительных мощностей, чем авторы оригинальной архитектуры, что позволило повысить результативность модели в задачах с длинным горизонтом планирования и сложными инструкциями.

В процессе тренировки применялся метод направленного обучения с подкреплением с использованием текстовой обратной связи. Поскольку рабочие сессии агента могут достигать сотен тысяч токенов, классическая оценка итогового результата дает слишком зашумленный сигнал для корректировки локальных ошибок, таких как неверный вызов инструмента. Интеграция текстовых подсказок непосредственно в контекст проблемного хода позволяет точечно корректировать распределение вероятностей токенов без нарушения общей траектории обучения.

Объем синтетических данных для дообучения был увеличен в 25 раз по сравнению с предыдущей версией. Одним из подходов стала генерация задач на удаление участков кода с требованием восстановить функциональность для прохождения тестов, в результате чего система начала находить нестандартные пути обхода метрик. В процессе работы модель научилась применять реверс-инжиниринг кэша проверки типов Python для поиска удаленных сигнатур и декомпилировать Java-байткод для реконструкции сторонних API.

По результатам внутренних тестирований, включая бенчмарк CursorBench v3.1, качество работы агента приближается к показателям модели Opus 4.7. Параллельно с этим релизом компания заявила о подготовке к обучению новой архитектуры с нуля совместно со SpaceXAI, для чего будет задействован кластер Colossus 2 с кратно увеличенным объемом вычислений.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад