🚀 RAG 2026: Как LLM заменили энкодеры в Retrieval

21 июня21 июн

~1 мин

! В 2026 году в области Retrieval (извлечение информации) произошли значительные изменения. Вместо традиционных энкодеров, таких как BERT, команды начали использовать финтюненные LLM (языковые модели) для создания эмбеддингов. Реранкинг также осуществляется с помощью LLM, а инференс (вывод) происходит на SGLang вместо ONNX. Это позволяет более эффективно адаптировать стек для узких доменов, где отсутствуют готовые датасеты. Например, можно использовать промпты: "Сравни эти документы по релевантности", "Какой из этих ответов более точный?" и "Определи ключевые темы в тексте". 🔍💡 🚀 ONIX AI - лучший способ быть в курсе новостей.

🚀 RAG 2026: Как LLM заменили энкодеры в Retrieval!

В 2026 году в области Retrieval (извлечение информации) произошли значительные изменения. Вместо традиционных энкодеров, таких как BERT, команды начали использовать финтюненные LLM (языковые модели) для создания эмбеддингов. Реранкинг также осуществляется с помощью LLM, а инференс (вывод) происходит на SGLang вместо ONNX. Это позволяет более эффективно адаптировать стек для узких доменов, где отсутствуют готовые датасеты. Например, можно использовать промпты: "Сравни эти документы по релевантности", "Какой из этих ответов более точный?" и "Определи ключевые темы в тексте". 🔍💡

🚀 ONIX AI - лучший способ быть в курсе новостей.