Найти в Дзене
Максим Кульгин

База данных

или не совсем база данных в привычном понимании (как MySQL или Postgres), - новый подход к архитектуре RAG (Retrieval-Augmented Generation). Если кратко: это «убийца» векторного поиска для сложных документов :) Проект называется PageIndex от компании VectifyAI. Вот здесь. Обычный RAG работает так: режет текст на куски (чанки), превращает их в цифры (вектора) и ищет похожие по смыслу фрагменты. PageIndex делает иначе: он имитирует поведение человека. Когда вы открываете сложный отчет, вы не ищете "похожие слова», вы смотрите в оглавление, понимаете структуру и идете в нужный раздел. PageIndex строит иерархическое дерево (Tree Index) документа. Русский ИТ бизнес

База данных... или не совсем база данных в привычном понимании (как MySQL или Postgres), - новый подход к архитектуре RAG (Retrieval-Augmented Generation). Если кратко: это «убийца» векторного поиска для сложных документов :)

Проект называется PageIndex от компании VectifyAI. Вот здесь.

Обычный RAG работает так: режет текст на куски (чанки), превращает их в цифры (вектора) и ищет похожие по смыслу фрагменты. PageIndex делает иначе: он имитирует поведение человека. Когда вы открываете сложный отчет, вы не ищете "похожие слова», вы смотрите в оглавление, понимаете структуру и идете в нужный раздел. PageIndex строит иерархическое дерево (Tree Index) документа.

Русский ИТ бизнес