Это действительно мощное обновление для всех, кто встраивает генеративные нейросети в свои продукты. Google открыл общий доступ к Nano Banana 2 (под капотом Gemini 3.1 Flash Image) и Nano Banana Pro (Gemini 3 Pro Image). Обе модели теперь стабильно работают по API через Gemini Enterprise Agent Platform. Генерация в разрешениях 1K и 2K ушла в полноценный релиз, а 4K пока остается в стадии превью.
Но самая впечатляющая фича кроется в работе с контекстом. Nano Banana 2 научилась принимать видеофайлы в качестве входного промпта! Модель не просто выдергивает случайные кадры, а полноценно анализирует происходящее на видео, понимает действия объектов и визуальную логику. Опираясь на этот анализ, нейросеть может генерировать контекстно-зависимые арты, точные превью-обложки или сложную инфографику.
Крупные платформы уже начали переводить на эти модели свои пайплайны. Adobe встроил их в Firefly Enterprise для автоматизации создания контента, а Shopify использует для запуска виртуальных примерочных и динамического расширения карточек товаров. Фокус явно сместился с простых текстовых генераций на сложные сценарии, где требуется жесткий контроль над результатом и понимание сложных мультимодальных данных.
Поделиться:
taste-skill: можно ли запрограммировать хороший вкус для AI-агентов
Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust