Найти в Дзене
I N F A N D S E C

Как повысить точность RAG-агентов с помощью Graph RAG?

Вопрос «Как сделать моих RAG-агентов более точными?» наверняка всплывал у каждого, кто хоть раз работал с retrieval-augmented generation (RAG). Традиционные методы часто дают базовые ответы, но когда дело доходит до комплексных связей между данными, они начинают сдавать позиции. Решение — Graph RAG. Что это такое и как его внедрить — именно об этом расскажем дальше. Начнём с простого. В классическом RAG мы берём документы, разбиваем их на чанки — небольшие части текста, чтобы облегчить поиск. Каждому чанку ставится в соответствие числовой вектор — эмбеддинг. Эти эмбеддинги загружаются в векторную базу данных. Когда вы задаёте вопрос, он тоже преобразуется в эмбеддинг. Система ищет в базе наиболее близкие к запросу векторы и отдаёт их в языковую модель, которая формирует ответ. Простая аналогия — библиотека. Векторы — это книги, а языковая модель — библиотекарь, который находит ближайшую по теме книгу, чтобы дать вам ответ. Graph RAG работает по схожему принципу: разбивка на чанк
Оглавление

Вопрос «Как сделать моих RAG-агентов более точными?» наверняка всплывал у каждого, кто хоть раз работал с retrieval-augmented generation (RAG). Традиционные методы часто дают базовые ответы, но когда дело доходит до комплексных связей между данными, они начинают сдавать позиции. Решение — Graph RAG. Что это такое и как его внедрить — именно об этом расскажем дальше.

Что такое традиционный RAG?

Начнём с простого. В классическом RAG мы берём документы, разбиваем их на чанки — небольшие части текста, чтобы облегчить поиск. Каждому чанку ставится в соответствие числовой вектор — эмбеддинг. Эти эмбеддинги загружаются в векторную базу данных.

Когда вы задаёте вопрос, он тоже преобразуется в эмбеддинг. Система ищет в базе наиболее близкие к запросу векторы и отдаёт их в языковую модель, которая формирует ответ.

Простая аналогия — библиотека. Векторы — это книги, а языковая модель — библиотекарь, который находит ближайшую по теме книгу, чтобы дать вам ответ.

Что такое Graph RAG и почему он лучше?

Graph RAG работает по схожему принципу: разбивка на чанки, эмбеддинги, векторизация. Но при этом он дополнительно выделяет сущности и отношения между ними из текста. Эти связи формируются в структуру знаний — граф, где сущности — это узлы, а отношения — рёбра между ними.

Например, из документа выделяется триплет «Ирина П — CEO компании ООО Ромашка». Эта информация добавляется в граф, где Ирина П — узел, связь «CEO» — ребро, а ООО Ромашка— другой узел.

Благодаря этому графу мы получаем не просто отдельные фрагменты текста, а контекстные взаимосвязи между ними. Это значительно повышает качество ответов и позволяет системе «думать» комплексно.

Преимущества и недостатки Graph RAG

Что мы выигрываем?

- Более точные и содержательные ответы. Система учитывает взаимосвязи и контекст, а не просто ищет близкие векторы.

- Умение работать с комплексными вопросами. Например, запросы с анализом изменений во времени, влиянием одних событий на другие.

- Поддержка сложных сценариев, когда важны связи между данными.

Но есть и минусы:

- Рост затрат. Построение графа и обработка больших документов требует больше ресурсов.

- Замедление работы. На создание эмбеддингов и графа уходит больше времени.

- Пример: для загрузки около 1,200 страниц (трилогия «Властелина колец») потребовалось ~1,5 часа и около 8 долларов только на эмбеддинги при использовании недорогой модели GPT-5 Nano.

Граф RAG — это мощный, но ресурсоёмкий инструмент, который стоит использовать там, где высока сложность данных.

Как разворачивать Graph RAG-систему? Практика на примере Light RAG и Render

Для создания полноценного Graph RAG рекомендуем обратить внимание на Light RAG — open source решение, которое можно поставить локально или в облако.

В качестве облачного хостинга удобно использовать платформу Render.com (либо Beget.ru), я расскажу на примере иностранного ресурса:

1. Создаёте веб-сервис в Render, указываете Docker-образ Light RAG.

2. На старте выбираете хотя бы стартовый тариф, чтобы хватило ресурсов.

3. Настраиваете переменные окружения: API-ключи для языковых моделей (OpenAI GPT-5 Nano), сервисов эмбеддингов и ранжирования (например, Cohere).

4. Разворачиваете приложение и получаете ссылку на веб-интерфейс и API.

5. Загружаете документы (текстовые форматы — txt, docx, pdf без картинок) и строите граф знаний.

В интерфейсе Light RAG вы увидите:

- Список загруженных документов и статус их обработки.

- Граф с узлами-сущностями и рёбрами-отношениями.

- Возможность задавать вопросы и получать ответы с указанием источников.

Интеграция Graph RAG с AI-агентом на платформе Naden

Чтобы использовать Graph RAG в реальном AI-агенте, нужно связать API Light RAG с платформой вроде Naden:

- Создаёте простой агент с триггером на чат.

- К чат-сообщениям добавляете HTTP-запрос к Light RAG, который отправляет вопросы и получает ответы.

- Для автоматизации загрузки документов настраиваете пайплайн с Google Drive: любые файлы в определённой папке автоматически попадают в систему Light RAG.

- Добавляете механизм очистки – при удалении документов из Google Drive они автоматически удаляются и из графа, поддерживая синхронность данных.

Вы должны понимать что это только тестовое описание и все примеры лишь для демонстрации возможности! Помните, что в нашей стране есть ряд ограничений и требований к иностранным ресурсам! Будьте внимательны!
Незнание законов - не освобождают Вас от ответственности!

Вывод: когда и почему стоит использовать Graph RAG?

Graph RAG — отличный выбор там, где:

- Нужно работать с комплексными взаимосвязанными данными.

- Нужна глубокая аналитика и связывание фактов.

- Вопросы выходят за рамки простых фактов и требуют осмысления контекста.

При простых задачах — банальных FAQ или небольших наборов документов — классический RAG остаётся быстрее и дешевле.

Важно помнить: Graph RAG — не панацея, а мощный инструмент в вашем арсенале. Кроме традиционного RAG и Graph RAG скоро появится и третий подход — GenTech RAG, который будет работать с большими таблицами и структурированными данными, вроде SQL-баз.

Так что выбор технологии зависит от задачи. Хотите точности, контекста и аналитики — берите Graph RAG. Нужны быстрые и недорогие ответы — традиционный RAG ваш выбор.