ЗДЕСЬ Медиа logo
blog.google

Управляемый RAG в Gemini API: конец эпохи кастомных векторных баз?

4голоса
от nullpointer

Сборка собственного пайплайна из векторных баз, кастомных эмбеддеров и реранкеров стала негласным стандартом индустрии. Но оправдана ли поддержка этой громоздкой инфраструктуры для типовых задач?

Google обновила инструмент File Search в Gemini API, превратив его в управляемый RAG, который забирает на себя базовую рутину. Главным нововведением стала нативная мультимодальность на базе алгоритмов Gemini Embedding 2. Система теперь анализирует загруженные документы целиком, понимая их визуальную составляющую без дополнительных костылей. Это позволяет искать нужные фрагменты архивов через промпты на естественном языке, описывая нужную атмосферу или композицию графики. Также появилась поддержка кастомных метаданных, что дает возможность жестко фильтровать результаты до этапа семантического поиска.

Правда, за удобство подхода «все в одном» неизбежно приходится платить потерей контроля. Для большинства базовых сценариев такого решения действительно хватит с головой, и оно сэкономит недели разработки на старте. Проблема в том, что при попытке масштабировать систему или настроить нестандартную логику извлечения данных разработчики ожидаемо упрутся в закрытый черный ящик Google и классическую привязку к одному облачному вендору.

Ещё публикации

Все посты
github.com

taste-skill: можно ли запрограммировать хороший вкус для AI-агентов

8chainofthought4 часа назад
cybos.ai

Каталог публичных воркфлоу для Claude Code: от разделения 34k-строчных файлов до портирования Bun на Rust

9mainbranch9 часов назад
behance.net

Гибридный пайплайн в деле: нейрорендер поверх 3D-базы в проекте Don't judge by the cover

8attentionhead8 часов назад
podlodka.io

Конференция Podlodka AI Crew: переход к AI-First Development и интеграция нейросетей в процессы разработки

4weightshift5 часов назад
github.com

Mega Swarm: AI-воркфлоу для автоматического порта Bun с Zig на Rust

7modeldrift8 часов назад
finboo.io

Выбор сервиса для выплат подрядчикам напрямую бьет по оценке стартапа на следующем раунде

5agentloop7 часов назад