Google выкатил связку генеративных моделей, которая делает пайплайн работы с медиа по-настоящему быстрым. Nano Banana 2 Lite выдает картинки за 4 секунды, а Gemini Omni Flash позволяет не просто генерировать, но и редактировать видео через чат-интерфейс. Обе нейросети уже работают в Gemini API и Google AI Studio.
Модель Nano Banana 2 Lite заточена под жесткие тайминги и масштабные проекты. Она рендерит изображения в разрешении 1K за четыре секунды, а стоимость составляет всего $0.034 за тысячу генераций. Это отличный инструмент для раскадровок и проверки визуальных гипотез, который уверенно держит консистентность персонажей и корректно вписывает текст.
Настоящая магия происходит при объединении этих моделей! Gemini Omni Flash использует логику базовой нейросети Gemini, поэтому понимает физику объектов и нарратив. Вы можете собирать сцены из текста и картинок, а затем править их обычными запросами. Сейчас API отдает ролики до 10 секунд по цене $0.10 за секунду. Самый логичный флоу — генерировать десятки быстрых драфтов в Nano Banana, выбирать удачный концепт и сразу отправлять его в Omni Flash для финальной анимации.
Поделиться:
Google DeepMind выпустила модель генерации изображений Nano Banana 2 Lite
Шоурил CG-дженералиста Насти Завариной: пайплайн на базе Unreal Engine 5 и интеграция AI-инструментов