ЗДЕСЬ Медиа logo
longcat.chat

Meituan выпустила LongCat-2.0: MoE-модель на 1,6 трлн параметров, обученная на 50 тысячах ASIC

5голосов
от devnull

Meituan открыла исходный код LongCat-2.0. Это MoE-модель на 1,6 трлн параметров с 48 млрд активных весов на токен. Главная техническая особенность релиза — полный отказ от GPU Nvidia. Претрейн на 35 трлн токенов проходил на кластере из 50 тысяч китайских AI ASIC. По архитектуре они близки к чипам Huawei Ascend 910C. Ранее таких масштабов достигали только на железе Nvidia и TPU от Google.

Для обработки длинных запросов инженеры переработали механизм внимания из DeepSeek. Новая реализация LongCat Sparse Attention решает проблему узкого места в индексаторе. Этого добились за счет потокового чтения из памяти и иерархического скоринга. Модель целенаправленно тренировали на массиве данных с контекстом в 1 млн токенов. Эффективность параметров повысили через модуль N-gram Embedding на 135 млрд весов. Он расширяет пространство эмбеддингов почти в 100 раз. Это ощутимо снижает I/O-нагрузку на память при декодировании больших батчей.

Аппаратные ограничения китайских ASIC потребовали сложных решений для распределения нагрузки. Памяти на одном таком чипе меньше, чем в стандартном ускорителе H800. Поэтому разработчики применили сложный 6D-параллелизм. К стандартным методам шардирования добавили алгоритм EMBP для распараллеливания N-gram вычислений. Мониторинг инфраструктуры позволил провести миллионы часов вычислений без единого отката чекпоинта. На выходе получилась модель для сложных задач программирования. Она нативно поддерживает агентные фреймворки вроде Claude Code и OpenClaw для автономной работы с репозиториями.

Ещё публикации

Все посты
deepmind.google

Google DeepMind выпустила модель генерации изображений Nano Banana 2 Lite

6weightshift2 часа назад
youtu.be

Шоурил CG-дженералиста Насти Завариной: пайплайн на базе Unreal Engine 5 и интеграция AI-инструментов

9neuralpath4 часа назад
fontfabric.com

Guka: брусковая антиква на 18 начертаний с расширенной кириллицей

5drawmore2 часа назад
github.com

Синхронизация звука и видео: открытая модель MMAudio и сжатие данных с KVAE-Audio

6weightshift3 часа назад
chishbak.gumroad.com

Анимация Gaussian Splats в Houdini: пайплайн с KineFX и APEX

4keyframed5 часов назад
console.cloud.google.com

Модель Nano Banana 2 Lite от Google с генерацией за 4 секунды стала доступна в API

5deepfake6 часов назад