ЗДЕСЬ Медиа logo
blog.google

Голосовой интерфейс в Google Workspace, автономный агент Gemini Spark и управляемая генерация в Google Pics

4голоса
от promptsmith

Корпорации искренне верят, что мы мечтаем разговаривать со своими текстовыми редакторами. Google анонсировала масштабное обновление Workspace, где главным интерфейсом постепенно становится голос. Функции Live для Gmail, Docs и Keep теперь позволяют искать информацию в почте или структурировать хаотичные мысли в готовые документы без помощи рук. Правда, диктовать сложную структуру отчета в шумном опенспейсе — сомнительное удовольствие. Зато такой вектор отлично объясняет скорый выход умных очков на Android XR. Экосистема явно перестраивается под управление на ходу, где классическая клавиатура просто не предусмотрена.

Куда больше сомнений вызывает новый агент Gemini Spark. Это круглосуточный фоновый ИИ, который переходит от простых ответов к реальным действиям от вашего лица. Он анализирует переписки, пишет контекстные черновики в обновленном AI Inbox и управляет календарем. Разработчики обещают, что агент будет запрашивать разрешение перед критическими шагами вроде отправки писем. Вопрос в том, как быстро пользователи устанут вычитывать за ним каждое слово и начнут делегировать задачи вслепую, плодя бесконечный поток сгенерированного корпоративного спама.

На фоне автономных агентов действительно рабочим инструментом выглядит Google Pics. Это встроенный редактор на базе модели Nano Banana, который пытается решить старую проблему нейросетей — отсутствие точного контроля. Вместо бесконечного перебора промптов ради одной детали, здесь можно сегментировать объекты, менять их свойства и переводить текст прямо на макете с сохранением оригинального шрифта. По сути, Google собирает возможности продвинутого графического редактора и встраивает их в Slides и Drive с поддержкой совместного доступа. Если инструменты сегментации работают без сбоев, генеративный дизайн перестанет быть лотереей и станет предсказуемым процессом.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад