Гибридный поиск в энтерпрайзе вырос в 3 раза за квартал: рынок объединил старые добрые ключевые слова с эмбеддингами, потому что «наивный» RAG на одних векторах сыпется в реальном продакшене. Пока все ждали, что бесконечный контекст убьет поиск, стало ясно — гибриды работают лучше. Большинство тех, кто начинал внедрять RAG в 2023-м, попали в одну ловушку. В демо на десяти файлах всё работает идеально: модель находит нужный кусок текста и выдает ответ. Но стоит засунуть в систему миллион документов, как наступает «стена масштабирования». Проблема в том, что векторный поиск — это поиск по «вайбу». Эмбеддинги превращают текст в координаты в многомерном пространстве. Если ты ищешь «ошибку в API при оплате через СБП», векторный поиск найдет всё, что семантически похоже на «проблемы с платежами». Но если нужен конкретный код ошибки, например «ERR_PAY_502», векторный поиск может его проигнорировать, потому что для него этот набор символов не имеет «смысла». Это как искать нужную папку в огром
RAG на векторах врет: гибридный поиск дает Recall 91%
30 апреля30 апр
5
3 мин