Найти Ρ‚Π΅ΠΌΡƒ
10,2 тыс подписчиков

🌟 Lynx v1.1: МодСли c 8B ΠΈ 70B ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌΠΈ для обнаруТСния Π³Π°Π»Π»ΡŽΡ†ΠΈΠ½Π°Ρ†ΠΈΠΉ RAG.


LYNX - пСрвая модСль обнаруТСния Π³Π°Π»Π»ΡŽΡ†ΠΈΠ½Π°Ρ†ΠΈΠΉ с ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΌ исходным ΠΊΠΎΠ΄ΠΎΠΌ. Она прСдставляСт собой Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Ρ‚ΠΎΠ½ΠΊΠΎΠΉ настройки Llama-3-70B-Instruct Π½Π° комплСксном датасСтС ΠΈΠ· Ρ€Π°Π·Π½Ρ‹Ρ… областСй, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ финансы ΠΈ ΠΌΠ΅Π΄ΠΈΡ†ΠΈΠ½Ρƒ, с Π°ΠΊΡ†Π΅Π½Ρ‚ΠΎΠΌ Π½Π° слоТныС сцСнарии Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… запросов ΠΈ инфСрСнса.
Π”Π°Π½Π½Ρ‹Π΅ обучСния Π²ΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‚ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ ΠΈΠ· RAGTruth, DROP, CovidQA ΠΈ PubMedQA, с 300 ΠΎΠ±Ρ€Π°Π·Ρ†Π°ΠΌΠΈ Π½Π° источник, ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΡ€ΠΎΡˆΠ΅Π΄ΡˆΠΈΠΌΠΈ perturbed-ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΡƒ для создания "Π³Π°Π»Π»ΡŽΡ†ΠΈΠ½ΠΈΡ€ΡƒΡŽΡ‰ΠΈΡ…" ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ².
ΠŸΡ€ΠΎΡ†Π΅ΡΡ обучСния использовал Ρ†Π΅ΠΏΠΎΡ‡ΠΊΡƒ ΠΌΡ‹ΡˆΠ»Π΅Π½ΠΈΡ с GPT-4ΠΎ для ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ возмоТностСй рассуТдСния.

Π‘Ρ‹Π»ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½Ρ‹ Π΄Π²Π° Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Π° ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ: Lynx 70B ΠΈ Lynx 8B.
Для использования Π² Ollama, llama.cpp ΠΈ LM Studio Π±Ρ‹Π»ΠΈ созданы ΠΊΠ²Π°Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅ 4-bit GGUF вСрсии ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Lynx 8B ΠΈ 70B соотвСтствСнно.

Π§Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ±Π»Π΅Π³Ρ‡ΠΈΡ‚ΡŒ ΠΎΡ†Π΅Π½ΠΊΡƒ Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΈ ΠΏΡ€Π΅Π΄Π»Π°Π³Π°ΡŽΡ‚ HaluBench, Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊ Π³Π°Π»Π»ΡŽΡ†ΠΈΠ½Π°Ρ†ΠΈΠΉ, содСрТащий 15 000 ΠΌΠ°Ρ€ΠΊΠ΅Ρ€Π½Ρ‹Ρ… ΠΎΠ±Ρ€Π°Π·Ρ†ΠΎΠ², ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΈΠ· датасСтов: DROP, FinanceBench, COVID-QA, PubMedQA, HaluEval ΠΈ RAGTruth.

Для модСлирования Π³Π°Π»Π»ΡŽΡ†ΠΈΠ½Π°Ρ†ΠΈΠΈ, HaluBench ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ‚Π΅Ρ…Π½ΠΈΠΊΡƒ perturbed, ΠΏΡ€ΠΈ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΡŽΡ‚ΡΡ сСмантичСски ΠΈΠ·ΠΌΠ΅Π½Π΅Π½Π½Ρ‹Π΅ ΠΎΡ‚Π²Π΅Ρ‚Ρ‹, сохраняя ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Π΅ отличия ΠΎΡ‚ ΠΏΠ΅Ρ€Π²ΠΎΠ½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΎΡ‚Π²Π΅Ρ‚Π°. Π­Ρ‚ΠΎΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ выполняСт Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΡŽ слоТных ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ истолкованы ΠΊΠ°ΠΊ Π²Π΅Ρ€Π½Ρ‹Π΅, нСсмотря Π½Π° нСсоотвСтствия контСксту.

⚠️ Lynx фокусируСтся ΠΈΡΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π½Π° ΠΎΡ†Π΅Π½ΠΊΠ΅ Π²Π½ΡƒΡ‚Ρ€Π΅Π½Π½Π΅ΠΉ Π³Π°Π»Π»ΡŽΡ†ΠΈΠ½Π°Ρ†ΠΈΠΈ, которая ΠΎΡ†Π΅Π½ΠΈΠ²Π°Π΅Ρ‚ ΡΠΎΠ³Π»Π°ΡΠΎΠ²Π°Π½Π½ΠΎΡΡ‚ΡŒ сгСнСрированного тСкста с прСдоставлСнным контСкстом. ΠžΡ†Π΅Π½ΠΊΠ° Π²Π½Π΅ΡˆΠ½ΠΈΡ… Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² Π³Π°Π»Π»ΡŽΡ†ΠΈΠ½Π°Ρ†ΠΈΠΉ Π²Ρ‹Ρ…ΠΎΠ΄ΠΈΡ‚ Π·Π° Ρ€Π°ΠΌΠΊΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»Π° ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Lynx ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π·Π°ΠΏΡƒΡ‰Π΅Π½ нСсколькими способами: с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ollama, llama.cpp, LM Studio, Π² Π²ΠΈΠ΄Π΅ локального инфСрСнса ΠΈΠ»ΠΈ ΠΊΠ°ΠΊ интСграция с NVIDIA NeMo-Guardrails:
πŸŸ’ΠΈΠ½ΡΡ‚Ρ€ΡƒΠΊΡ†ΠΈΡŽ ΠΏΠΎ запуску для llama.cpp ΠΌΠΎΠΆΠ½ΠΎ Π½Π°ΠΉΡ‚ΠΈ Π½Π° страницС GGUF вСрсии ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° HF;
πŸŸ’ΠΈΠ½ΡΡ‚Ρ€ΡƒΠΊΡ†ΠΈΡ ΠΏΠΎ запуску для Ollama - Π½Π° страницС ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°;
πŸŸ’ΠΈΠ½ΡΡ‚Ρ€ΡƒΠΊΡ†ΠΈΡ ΠΏΠΎ ΠΈΠ½Ρ‚Π΅Π³Ρ€Π°Ρ†ΠΈΠΈ с NVIDIA NeMo-Guardrails Π² Ρ€Π΅ΠΏΠΎΠ·ΠΈΡ‚ΠΎΡ€ΠΈΠΈ NeMo-Guardrails.

β–ΆοΈΠ›ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ запуск (инфСрСнс ΠΈ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΊΠ°):

# Install local environment:
python -m venv .venv
source .venv/bin/activate
pip install --upgrade pip
pip install poetry==1.8.1
poetry update
poetry install

# Install pre-commit in your teminal and run:
pre-commit install

#CopyΒ .env.exampleΒ toΒ .envΒ and replace values for environmental variables.

#Установки Inference ΠΈ Finetuning Π½Π° mcli ΠΈ vLLM описаны Π² Ρ„Π°ΠΉΠ»Π°Ρ…:
# mcli/mcli_finetuning.md
# mcli/mcli_inference.md
# mcli/vllm_inference.md

πŸ“ŒΠ›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ : Π‘Π‘-BY-NC-4.0

🟑Arxiv
πŸ–₯Github [ Stars: 18 | Issues: 0 | Forks: 1]


#AI #Lynx #RAG #HallucinationDetection #LLM
🌟 Lynx v1.1: МодСли c 8B ΠΈ 70B ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌΠΈ для обнаруТСния Π³Π°Π»Π»ΡŽΡ†ΠΈΠ½Π°Ρ†ΠΈΠΉ RAG.  LYNX  - пСрвая модСль обнаруТСния Π³Π°Π»Π»ΡŽΡ†ΠΈΠ½Π°Ρ†ΠΈΠΉ с ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΌ исходным ΠΊΠΎΠ΄ΠΎΠΌ.
2 ΠΌΠΈΠ½ΡƒΡ‚Ρ‹