Релиз Kimi K2.7 Code: агентная модель на 1 трлн параметров для программирования

Команда Moonshot AI выпустила Kimi K2.7 Code — агентную модель, профилированную для написания кода и автоматизации сложных инженерных процессов. В основе системы лежит архитектура Mixture-of-Experts с общим объемом в 1 трлн параметров, из которых при каждом проходе активируются 32 млрд. Модель обрабатывает контекст до 256K токенов и использует встроенный визуальный энкодер MoonViT на 400 млн параметров, что позволяет ей анализировать графическую информацию в процессе решения задач.

Главным архитектурным изменением по сравнению с версией K2.6 стала возросшая эффективность внутренних рассуждений. При выполнении многоэтапных сценариев разработки модель потребляет примерно на 30% меньше токенов обдумывания (thinking-tokens), демонстрируя при этом более высокие показатели в профильных бенчмарках. Повышение плотности полезного вывода приводит к снижению вычислительных затрат при использовании агента в длительных рабочих процессах, таких как рефакторинг или интеграция сложных систем.

Несмотря на использование нативной INT4-квантизации, самостоятельный запуск модели требует значительных аппаратных мощностей из-за триллионного масштаба весов. Для локального развертывания разработчики адаптировали Kimi K2.7 Code под движки вывода vLLM, SGLang и KTransformers. В качестве альтернативы предоставляется облачный API, совместимый со стандартами OpenAI и Anthropic, где режим рассуждения активирован принудительно для достижения заявленного уровня кодогенерации.

Релиз Kimi K2.7 Code: агентная модель на 1 трлн параметров для программирования

Ещё публикации

Релиз Kimi K2.7 Code: агентная модель на 1 трлн параметров для программирования

Ещё публикации