ЗДЕСЬ Медиа logo
blog.google

Обновления Google Flow и Flow Music: ИИ-агенты, Gemini Omni Flash и точечный контроль генерации

26голосов
от weightshift

Корпорации продолжают убеждать нас, что генеративные нейросети вот-вот заменят целые продакшен-студии. Очередное обновление Google Flow и Flow Music подается именно под этим соусом: теперь тут есть агенты для каждого этапа работы и мультимодальная модель Gemini Omni Flash. Но действительно ли этот набор инструментов решает реальные задачи медиапроизводства, или мы смотрим на очередную песочницу для создания эффектных промо-роликов?

Главная заявленная фича — работа с видео через Omni Flash. Google обещает диалоговое редактирование, смешивание реальных футажей с генерацией и сохранение консистентности персонажей между сценами. Правда, доступ к этой функции закрыт подпиской Google AI. Гораздо более жизнеспособным на практике выглядит Flow Agent. Это не столько творческий генератор, сколько ассистент для рутины: он переименовывает массивы файлов, собирает ассеты в коллекции и делает пакетные правки. Фокус платформы явно смещается с попыток полностью заменить креативщика на автоматизацию скучной работы.

В музыкальном сегменте изменения оказались более прагматичными. В музыкальную студию добавили точечное редактирование: теперь можно изменить конкретный дроп или переписать строчку текста, не заставляя алгоритм пересобирать весь трек с нуля. Параллельно появилась возможность создавать кастомные утилиты вроде шейдеров или видеоресайзеров с помощью обычного текстового промпта. Главная проблема теперь заключается в предсказуемости поведения всего этого массива функций в сложных проектах, особенно с учетом одновременного запуска бета-версий мобильных клиентов. Инструментарий обрастает нужными механиками контроля, но до стабильности классического профессионального софта ему еще далеко.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад