Компания ByteDance открыла доступ к Seedance 2.0 Mini — облегченной версии видеогенеративной модели семейства Dreamina. Архитектура поддерживает мультимодальный ввод, позволяя комбинировать текстовые запросы с изображениями, видео и аудио. Система генерирует синхронизированный звук вместе с визуальным рядом, включая эффекты, фоновую музыку и диалоги, при этом реплики персонажей задаются через двойные кавычки непосредственно в промпте.
Модель разработана для интеграции в пайплайны с высокими объемами генерации, что обуславливает снижение стоимости примерно на 30% по сравнению с базовой версией и двукратное увеличение скорости обработки относительно варианта Fast. Механика работы с референсами допускает одновременную загрузку до девяти изображений, трех видеороликов и трех аудиофайлов, которые связываются между собой через теги вида [Image1] или [Video1] в текстовом описании. Поддерживается создание роликов длительностью до 15 секунд в разрешениях 480p и 720p, а также редактирование и расширение существующих видео.
Для автоматизированной обработки предусмотрены динамические параметры генерации. Установка отрицательного значения длительности активирует алгоритм подбора оптимального хронометража, в результате чего нейросеть сама определяет логическую точку завершения сцены, в то время как адаптивный режим соотношения сторон самостоятельно вычисляет требуемый формат кадра на основе загруженных исходных материалов.
Поделиться:
Брутальная айдентика японского чайного дома Lambert от студии SODAA
Без пассивной агрессии и корпоративного пафоса: как составить адекватное прощальное письмо при увольнении