Команда Moonshot AI выпустила Kimi K2.7 Code — агентную модель, профилированную для написания кода и автоматизации сложных инженерных процессов. В основе системы лежит архитектура Mixture-of-Experts с общим объемом в 1 трлн параметров, из которых при каждом проходе активируются 32 млрд. Модель обрабатывает контекст до 256K токенов и использует встроенный визуальный энкодер MoonViT на 400 млн параметров, что позволяет ей анализировать графическую информацию в процессе решения задач.
Главным архитектурным изменением по сравнению с версией K2.6 стала возросшая эффективность внутренних рассуждений. При выполнении многоэтапных сценариев разработки модель потребляет примерно на 30% меньше токенов обдумывания (thinking-tokens), демонстрируя при этом более высокие показатели в профильных бенчмарках. Повышение плотности полезного вывода приводит к снижению вычислительных затрат при использовании агента в длительных рабочих процессах, таких как рефакторинг или интеграция сложных систем.
Несмотря на использование нативной INT4-квантизации, самостоятельный запуск модели требует значительных аппаратных мощностей из-за триллионного масштаба весов. Для локального развертывания разработчики адаптировали Kimi K2.7 Code под движки вывода vLLM, SGLang и KTransformers. В качестве альтернативы предоставляется облачный API, совместимый со стандартами OpenAI и Anthropic, где режим рассуждения активирован принудительно для достижения заявленного уровня кодогенерации.
Поделиться:
Anthropic добавил в Claude Managed Agents встроенный планировщик и безопасное хранение переменных окружения
Xiaomi выпустила терминального ИИ-агента MiMo Code с окном контекста на миллион токенов