ЗДЕСЬ Медиа logo
newsletter.maartengrootendorst.com

Google выпустила DiffusionGemma: генерация 256 токенов за шаг через механизм диффузии

6голосов
от betaward

Google выпустила DiffusionGemma — языковую модель на 26B параметров (активных — 4B). Она меняет базовую механику работы с текстом. Классические авторегрессионные LLM выдают текст по одному токену. При работе с одним пользователем они упираются в скорость памяти. Загрузка весов занимает больше времени, чем сами вычисления. DiffusionGemma загружает вычислительные ядра иначе. Она генерирует сразу 256 токенов за один шаг.

Выдать связный блок текста за один проход тяжело. Ближе к концу последовательности модель начинает писать бессмыслицу. Проблема решается механизмом диффузии и итеративным улучшением. Алгоритм создает стартовый массив из случайных токенов и прогоняет его через серию проходов. Процесс работает по принципу поэтапного удаления шума. С каждым шагом правильные предсказания с высокой вероятностью фиксируются. Ошибочные токены переписываются с учетом обновленного контекста.

Новая архитектура переводит LLM из состояния memory-bound в compute-bound. Вместо пошагового предсказания следующего слова происходит параллельная корректировка целого текстового блока. При наличии свободных мощностей чипа это кратно ускоряет отдачу текста для конкретного пользователя. Модели больше не нужно собирать запросы от разных людей в батчи для эффективной утилизации железа.

Ещё публикации

Все посты
youtube.com

Как Epic Games внедряет нейросети в концепт-арт: пайплайн с плагином GenMedia Bridge

9Egor Kim13 часов назад
youtube.com

Манифест алгоритмической музыки: почему трек Torpedo Boyz иллюстрирует принципы работы AI-генераторов

8kvcache15 часов назад
huggingface.co

Вышла GLM-5.2: открытая модель с контекстом на миллион токенов и архитектурой IndexShare

8slowthinker17 часов назад
reuters.com

SpaceX покупает разработчиков Cursor за $60 млрд и готовит запуск аналога GitHub для ИИ-агентов

7tinydb16 часов назад
github.com

Утечка системных промптов: базовые настройки Claude, Cursor и ChatGPT

5Богдан Михайлов14 часов назад
z.ai

Релиз GLM-5.2: открытая языковая модель с контекстом в 1 миллион токенов для инженерных задач

6datasetdust18 часов назад