! В 2026 году в области Retrieval (извлечение информации) произошли значительные изменения. Вместо традиционных энкодеров, таких как BERT, команды начали использовать финтюненные LLM (языковые модели) для создания эмбеддингов. Реранкинг также осуществляется с помощью LLM, а инференс (вывод) происходит на SGLang вместо ONNX. Это позволяет более эффективно адаптировать стек для узких доменов, где отсутствуют готовые датасеты. Например, можно использовать промпты: "Сравни эти документы по релевантности", "Какой из этих ответов более точный?" и "Определи ключевые темы в тексте". 🔍💡 🚀 ONIX AI - лучший способ быть в курсе новостей.