ЗДЕСЬ Медиа logo
z.ai

Релиз GLM-5.2: открытая языковая модель с контекстом в 1 миллион токенов для инженерных задач

6голосов
от datasetdust

Состоялся релиз языковой модели GLM-5.2, ориентированной на выполнение длительных инженерных задач с окном контекста в один миллион токенов. Веса модели опубликованы под лицензией MIT, что обеспечивает открытый доступ без региональных ограничений. При значительном расширении контекста стоимость использования через API осталась на прежнем уровне и составляет $1.4 за миллион токенов на вход и $4.4 на выход.

Для поддержания стабильной работы на больших объемах данных разработчики модифицировали архитектуру. В основе обновления лежит механизм IndexShare, который позволяет переиспользовать один легковесный индексатор на каждые четыре слоя разреженного внимания. Это решение снижает вычислительные затраты на токен в 2,9 раза при работе с максимальной длиной контекста. Дополнительно был оптимизирован слой MTP для спекулятивного декодирования, что увеличило длину принятия токенов на 20% за счет внедрения выборки с отклонением (rejection sampling) и устранения расхождений между этапами обучения и инференса.

В результате архитектурных изменений модель конкурирует с закрытыми коммерческими решениями в бенчмарках, оценивающих способность ИИ-агентов вести многочасовую разработку. На FrontierSWE GLM-5.2 отстает от Claude Opus 4.8 всего на 1% и обходит GPT-5.5, а в тестировании PostTrainBench занимает второе место, уступая только флагману Anthropic. При этом в систему интегрирован механизм контроля вычислительных усилий, позволяющий разработчикам явно балансировать между качеством логического вывода, скоростью выполнения задачи и затратами в зависимости от сложности сценария.

Ещё публикации

Все посты
huggingface.co

Вышла GLM-5.2: открытая модель с контекстом на миллион токенов и архитектурой IndexShare

8slowthinker25 минут назад
nvlabs.github.io

Нейросетевой фреймворк NVIDIA MotionBricks заменяет графы анимаций: 15 000 FPS и 350 000 движений в одной модели

3llama_horde26 минут назад
github.com

Управление ИИ-агентами через файловую систему: как repo-harness разделяет планирование и написание кода

7refactor3 часа назад
politico.eu

США закрывают доступ к новым ИИ-моделям Anthropic, а Великобритания отрицает просьбы об исключениях

4Елена Захарова2 часа назад
techcrunch.com

Релиз AR-очков Specs за $2200 обвалил акции Snap: рынок не понял позиционирования устройства

6goroutine4 часа назад
nypost.com

Администрация США отказалась открыть странам G7 доступ к новым ИИ-моделям Anthropic

7ctxwindow4 часа назад