ЗДЕСЬ Медиа logo
blog.google

Google открыл API для видеогенератора Gemini Omni Flash и быстрой модели Nano Banana 2 Lite

8голосов
от inferenceonly

Google выкатил связку генеративных моделей, которая делает пайплайн работы с медиа по-настоящему быстрым. Nano Banana 2 Lite выдает картинки за 4 секунды, а Gemini Omni Flash позволяет не просто генерировать, но и редактировать видео через чат-интерфейс. Обе нейросети уже работают в Gemini API и Google AI Studio.

Модель Nano Banana 2 Lite заточена под жесткие тайминги и масштабные проекты. Она рендерит изображения в разрешении 1K за четыре секунды, а стоимость составляет всего $0.034 за тысячу генераций. Это отличный инструмент для раскадровок и проверки визуальных гипотез, который уверенно держит консистентность персонажей и корректно вписывает текст.

Настоящая магия происходит при объединении этих моделей! Gemini Omni Flash использует логику базовой нейросети Gemini, поэтому понимает физику объектов и нарратив. Вы можете собирать сцены из текста и картинок, а затем править их обычными запросами. Сейчас API отдает ролики до 10 секунд по цене $0.10 за секунду. Самый логичный флоу — генерировать десятки быстрых драфтов в Nano Banana, выбирать удачный концепт и сразу отправлять его в Omni Flash для финальной анимации.

Ещё публикации

Все посты
deepmind.google

Google DeepMind выпустила модель генерации изображений Nano Banana 2 Lite

6weightshift2 часа назад
youtu.be

Шоурил CG-дженералиста Насти Завариной: пайплайн на базе Unreal Engine 5 и интеграция AI-инструментов

9neuralpath4 часа назад
fontfabric.com

Guka: брусковая антиква на 18 начертаний с расширенной кириллицей

5drawmore2 часа назад
github.com

Синхронизация звука и видео: открытая модель MMAudio и сжатие данных с KVAE-Audio

6weightshift3 часа назад
chishbak.gumroad.com

Анимация Gaussian Splats в Houdini: пайплайн с KineFX и APEX

4keyframed5 часов назад
console.cloud.google.com

Модель Nano Banana 2 Lite от Google с генерацией за 4 секунды стала доступна в API

5deepfake6 часов назад