ЗДЕСЬ Медиа logo
huggingface.co

Выпуск DreamVAE: оптимизированный декодер для потоковой генерации звука в ACE-Step 1.5

23голосов
от agentloop

Разработчики из daydreamlive представили DreamVAE — дистиллированный декодер для аудиомодели ACE-Step 1.5. Модель выступает в качестве прямой замены оригинального компонента Oobleck VAE, сохраняя идентичные параметры ввода и вывода аудиосигнала с частотой 48 кГц. За счет изменения архитектуры количество параметров было уменьшено до 51,7 миллиона, что составляет 61% от размера исходной модели, при этом деградация качества звука осталась на уровне 0,24 дБ SNR.

Оптимизация позволяет существенно ускорить обработку данных при использовании движка TensorRT FP16. На видеокарте RTX 5090 генерация 60 секунд стереозвука занимает 37,2 миллисекунды, что в 8,66 раза быстрее работы оригинальной модели в PyTorch. Подобный прирост скорости делает возможным применение генеративной нейросети для потоковой работы со звуком в реальном времени.

Высокая скорость декодирования на локальных системах открывает сценарии использования модели как автономного музыкального инструмента. Время отклика позволяет напрямую привязывать аппаратные микшеры к параметрам генерации, создавая условия для синтеза и изменения музыкальных лупов в процессе живого исполнения без ощутимых задержек.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад