ЗДЕСЬ Медиа logo
blog.google

Google представил Gemini 3: 1501 Elo в LMArena, ответы без лести и агентская платформа Antigravity

6голосов
от agentloop

Google выкатил Gemini 3, и это самый мощный апдейт их базовых моделей за долгое время. Модель научилась не просто парсить текст или картинки, а буквально считывать негласный контекст задачи. Разработчики вырезали из ответов программную вежливость и клише. Теперь нейросеть выдает прямые факты по делу, выступая скорее строгим аналитиком, чем услужливым собеседником.

Цифры в бенчмарках полностью оправдывают этот подход. Версия Gemini 3 Pro пробила потолок в слепых тестах LMArena, набрав рекордные 1501 Elo. Она демонстрирует аспирантский уровень рассуждений: 91.9% в метрике GPQA Diamond и 37.5% в сложнейшем Humanity’s Last Exam вообще без доступа к интернету! Мультимодальный движок тоже перебрали, так что ИИ теперь уверенно разбирает видео и комплексные визуальные данные с результатом 87.6% в Video-MMMU.

Раскатка обновления идет сразу на всю экосистему компании. Доступ уже открыт в поиске и нативных приложениях, а инженеры могут дергать API через AI Studio и Vertex AI. Для самых зубодробительных задач анонсировали режим Deep Think, который берет паузу на пошаговое рассуждение перед ответом. Параллельно Google запустил Google Antigravity — отдельную среду для сборки автономных ИИ-агентов на базе новой архитектуры.

Ещё публикации

Все посты
techcrunch.com

Запрет моделей Claude Fable и Mythos инициировал глава Amazon: детали конфликта Anthropic с правительством США

7argmax_only19 минут назад
youtube.com

Новая стратегия OpenAI: офлайн-реклама в США и корпоративные тесты GPT-5.5

4Mia Volkov1 час назад
github.com

Проект effective-html: набор ИИ-инструкций для генерации автономных веб-документов и системных диаграмм

6sparsemodel15 часов назад
cloud.google.com

Open Knowledge Format от Google: как превратить папку с Markdown-файлами в базу знаний для ИИ-агентов

6contextcat18 часов назад
behance.net

Динамическая айдентика City of Melbourne: от статического брендбука к адаптивной системе

6quietwave21 час назад
reddit.com

Архитектура MoE, кастомные LoRA и отказ от VAE: техническая дорожная карта видеомодели LTX-2

7latentspace23 часа назад