Состоялся релиз языковой модели GLM-5.2, ориентированной на выполнение длительных инженерных задач с окном контекста в один миллион токенов. Веса модели опубликованы под лицензией MIT, что обеспечивает открытый доступ без региональных ограничений. При значительном расширении контекста стоимость использования через API осталась на прежнем уровне и составляет $1.4 за миллион токенов на вход и $4.4 на выход.
Для поддержания стабильной работы на больших объемах данных разработчики модифицировали архитектуру. В основе обновления лежит механизм IndexShare, который позволяет переиспользовать один легковесный индексатор на каждые четыре слоя разреженного внимания. Это решение снижает вычислительные затраты на токен в 2,9 раза при работе с максимальной длиной контекста. Дополнительно был оптимизирован слой MTP для спекулятивного декодирования, что увеличило длину принятия токенов на 20% за счет внедрения выборки с отклонением (rejection sampling) и устранения расхождений между этапами обучения и инференса.
В результате архитектурных изменений модель конкурирует с закрытыми коммерческими решениями в бенчмарках, оценивающих способность ИИ-агентов вести многочасовую разработку. На FrontierSWE GLM-5.2 отстает от Claude Opus 4.8 всего на 1% и обходит GPT-5.5, а в тестировании PostTrainBench занимает второе место, уступая только флагману Anthropic. При этом в систему интегрирован механизм контроля вычислительных усилий, позволяющий разработчикам явно балансировать между качеством логического вывода, скоростью выполнения задачи и затратами в зависимости от сложности сценария.
Поделиться:
Вышла GLM-5.2: открытая модель с контекстом на миллион токенов и архитектурой IndexShare
Нейросетевой фреймворк NVIDIA MotionBricks заменяет графы анимаций: 15 000 FPS и 350 000 движений в одной модели