ЗДЕСЬ Медиа logo
io.google

Ожидаемые анонсы Google I/O: видеомодель Omni, Desktop Agent и ассистент Gemini Spark

19голосов
от tokenlimit

Сегодня в 20:00 по Москве стартует конференция Google I/O. Главный фокус трансляции смещен на агентов и мультимодальную генерацию. Компания готовится показать инструменты для автоматизации рутины и работы с медиа.

Среди ожидаемых анонсов выделяется Google Omni. Это новая мультимодальная контекстная видеомодель. Она работает по принципу Seedance 2, но интегрирована прямо в интерфейс Gemini. Для работы с ОС Google готовит Gemini Desktop Agent. Инструмент позволит нейросети напрямую управлять рабочим столом. Это прямой ответ на недавний релиз Claude Cowork.

Также ожидается запуск Remy (или Gemini Spark). Это фоновый ассистент для постоянной помощи с рабочими задачами. Базовой моделью для новых инструментов должна стать Gemini 4. Google делает ставку на бесшовную интеграцию AI в экосистему. Нейросети переходят от текстовых чатов к полноценному управлению интерфейсами.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад