Одной из главных проблем современных RAG-систем и семантического поиска остаётся качество поиска документов. Даже хорошие эмбеддинг-модели регулярно возвращают документы, которые выглядят похожими по смыслу, но на самом деле не содержат нужного ответа. Особенно заметно это становится в юридических системах, финансовой аналитике, поиске по документации и кодовым базам. Для решения этой проблемы всё чаще используется двухэтапный подход: В качестве такого cross-encoder можно использовать zeroentropy/zerank-2-reranker — 4-миллиардную модель на базе Qwen3, предназначенную для высокоточного ранжирования пар «запрос-документ». В этой статье разберём полный конвейер: от загрузки модели до построения полноценной retrieve-and-rerank системы с оценкой качества через NDCG@10. Для начала понадобятся библиотеки Sentence Transformers, Transformers и Accelerate. После загрузки модель готова принимать пары «запрос-документ» и определять, насколько документ соответствует запросу. Первый шаг — посмотреть
Как повысить точность RAG и поиска: строим Retrieve-and-Rerank конвейер с ZeroEntropy Zerank-2
ВчераВчера
2
3 мин