Большинство RAG-систем используют bi-encoder. Он кодирует запрос и документы отдельно и сравнивает их по косинусному сходству. Это быстро и масштабируется на миллионы документов. Но модель не видит запрос и документ вместе, поэтому путается в нюансах.
✅Похожие слова не равны похожему смыслу
Ошибка 404 != ошибка 500.
Java backend != JavaScript frontend.