Модель Gemini 3.5 Flash получила встроенную функцию управления компьютером прямо из коробки. Ранее для этих задач Google предлагала отдельную версию Gemini 2.5 computer use. Теперь агентное управление интегрировано в основную легковесную модель. Это заметно снижает стоимость базовой автоматизации рутинных процессов.
Нейросеть визуально считывает интерфейс, анализирует контекст и выполняет целевые действия. Модель нативно работает в браузерах, мобильных системах и десктопных средах. Агенты самостоятельно кликают по элементам, вводят текст и переключают окна. Разработчики могут задействовать API для сборки сложных многошаговых сценариев.
Основной фокус обновления направлен на корпоративный сегмент и разработчиков. Инструмент закрывает потребности в непрерывном тестировании сложного программного обеспечения. Также алгоритм автоматизирует долгие рабочие процессы внутри тяжелых профессиональных приложений. Перенос функции в базовую модель удешевляет массовое создание автономных ИИ-агентов.
Поделиться:
Пайплайн современного CG-дженералиста: интеграция Unreal Engine, Blender и нейросетей в VFX
Инфраструктура GitVerse пополнилась публичным зеркалом репозитория PyPI