Alibaba выпустила обновление своей видеомодели — Happy Horse 1.1 теперь доступна через API платформы fal. Фокус релиза смещен на интеграцию звука. Эндпоинт умеет генерировать видео в разрешении 1080p с нативной аудиодорожкой и мультиязычным липсинком исключительно по текстовому промпту. Также заявлена поддержка до девяти референсов на входе для режима i2v.
Практика показывает, что версия 1.1 оказалась скорее минорным техническим патчем. Улучшенная синхронизация губ действительно работает стабильнее, но общая динамика сцены изменилась незначительно. В профильных сообществах разработчики по-прежнему отдают предпочтение генераторам уровня Seedance, которые выдают более предсказуемый результат при сложных запросах.
Для коммерческого использования тарификация эндпоинта alibaba/happy-horse/v1.1/text-to-video привязана к длительности результата. Секунда сгенерированного видео в 720p обойдется в $0.14, а за разрешение 1080p придется платить $0.18 за секунду. Такой пайплайн имеет смысл для автоматизации создания разговорных форматов, где критично точное совпадение текста и артикуляции без настройки дополнительных нейросетей.
Поделиться:
Гайд по Xcode для дизайнеров: как собирать iOS-приложения с помощью Claude Code
Пайплайн AI-видео: как связка Unreal Engine и Kling решает проблему консистентности кадров