Найти Π² Π”Π·Π΅Π½Π΅
МашинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

πŸš€ Π’Ρ‹ΡˆΠ΅Π» QwenLong-L1.5 - модСль для long-context reasoning, которая Π½Π° Π΄Π»ΠΈΠ½Π½Ρ‹Ρ… контСкстах ΠΊΠΎΠ½ΠΊΡƒΡ€ΠΈΡ€ΡƒΠ΅Ρ‚ с GPT-5 ΠΈ Gemini-2

5-Pro. ΠšΠΎΡ€ΠΎΡ‚ΠΊΠΎ ΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈ - 30B ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², ΠΈΠ· Π½ΠΈΡ… 3B Π°ΠΊΡ‚ΠΈΠ²Π½Ρ‹Ρ… - Π—Π°Ρ‚ΠΎΡ‡Π΅Π½Π° ΠΏΠΎΠ΄ рассуТдСниС Π½Π° ΠΎΡ‡Π΅Π½ΡŒ Π΄Π»ΠΈΠ½Π½Ρ‹Ρ… контСкстах - ΠŸΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ вСса, ΠΊΠΎΠ΄ обучСния ΠΈ Ρ€Π΅Ρ†Π΅ΠΏΡ‚Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ… ΠšΠ»ΡŽΡ‡Π΅Π²Ρ‹Π΅ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ: - +31.7 Π±Π°Π»Π»Π° Π½Π° OpenAI MRCR ΠΏΡ€ΠΈ контСкстС 128K - SOTA срСди всСх ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ - На ΡƒΡ€ΠΎΠ²Π½Π΅ Gemini-2.5-Pro Π½Π° 6 ΠΊΡ€ΡƒΠΏΠ½Ρ‹Ρ… long-QA Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠ°Ρ… - +9.69 Π½Π° CorpusQA - +6.16 Π½Π° LongBench-V2 Π§Ρ‚ΠΎ интСрСсного. 1. БинтСтичСскиС Π΄Π°Π½Π½Ρ‹Π΅ Π² ΠΌΠ°ΡΡˆΡ‚Π°Π±Π΅ 14.1K Π΄Π»ΠΈΠ½Π½Ρ‹Ρ… reasoning-сэмплов ΠΈΠ· 9.2B Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² Π±Π΅Π· Ρ€ΡƒΡ‡Π½ΠΎΠΉ Ρ€Π°Π·ΠΌΠ΅Ρ‚ΠΊΠΈ. БрСдняя Π΄Π»ΠΈΠ½Π° - 34K Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ², максимум - 119K. 2. Π‘Ρ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΠ΅ RL-ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ балансировка Π·Π°Π΄Π°Ρ‡ ΠΈ Adaptive Entropy-Controlled Policy Optimization (AEPO), Ρ‡Ρ‚ΠΎ позволяСт ΡΡ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° Π΄Π»ΠΈΠ½Π½Ρ‹Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ…. 3. АрхитСктура с ΠΏΠ°ΠΌΡΡ‚ΡŒΡŽ Π˜Ρ‚Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½Ρ‹Π΅ обновлСния памяти Π·Π° ΠΏΡ€Π΅Π΄Π΅Π»Π°ΠΌΠΈ ΠΎΠΊΠ½Π° 256K Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ². Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ - +9.48 Π±Π°Π»Π»Π° Π½Π° Π·Π°Π΄Π°Ρ‡Π°Ρ… с контСкстом ΠΎΡ‚ 1M Π΄ΠΎ 4M Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ². QwenLong-L1.5 - это ΠΎΠ΄ΠΈΠ½ ΠΈΠ· самых ΡΠΈΠ»ΡŒΠ½Ρ‹Ρ… open-source шагов Π² сторону Ρ€Π΅Π°Π»ΡŒΠ½ΠΎ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠ³ΠΎ Ρ€ΠΈΠ·ΠΎΠ½ΠΈΠ½Π³Π° с Π΄Π»ΠΈΠ½Π½Ρ‹ΠΌ

πŸš€ Π’Ρ‹ΡˆΠ΅Π» QwenLong-L1.5 - модСль для long-context reasoning, которая Π½Π° Π΄Π»ΠΈΠ½Π½Ρ‹Ρ… контСкстах ΠΊΠΎΠ½ΠΊΡƒΡ€ΠΈΡ€ΡƒΠ΅Ρ‚ с GPT-5 ΠΈ Gemini-2.5-Pro.

ΠšΠΎΡ€ΠΎΡ‚ΠΊΠΎ ΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈ

- 30B ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², ΠΈΠ· Π½ΠΈΡ… 3B Π°ΠΊΡ‚ΠΈΠ²Π½Ρ‹Ρ…

- Π—Π°Ρ‚ΠΎΡ‡Π΅Π½Π° ΠΏΠΎΠ΄ рассуТдСниС Π½Π° ΠΎΡ‡Π΅Π½ΡŒ Π΄Π»ΠΈΠ½Π½Ρ‹Ρ… контСкстах

- ΠŸΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ вСса, ΠΊΠΎΠ΄ обучСния ΠΈ Ρ€Π΅Ρ†Π΅ΠΏΡ‚Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ…

ΠšΠ»ΡŽΡ‡Π΅Π²Ρ‹Π΅ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ:

- +31.7 Π±Π°Π»Π»Π° Π½Π° OpenAI MRCR ΠΏΡ€ΠΈ контСкстС 128K - SOTA срСди всСх ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ

- На ΡƒΡ€ΠΎΠ²Π½Π΅ Gemini-2.5-Pro Π½Π° 6 ΠΊΡ€ΡƒΠΏΠ½Ρ‹Ρ… long-QA Π±Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠ°Ρ…

- +9.69 Π½Π° CorpusQA

- +6.16 Π½Π° LongBench-V2

Π§Ρ‚ΠΎ интСрСсного.

1. БинтСтичСскиС Π΄Π°Π½Π½Ρ‹Π΅ Π² ΠΌΠ°ΡΡˆΡ‚Π°Π±Π΅

14.1K Π΄Π»ΠΈΠ½Π½Ρ‹Ρ… reasoning-сэмплов ΠΈΠ· 9.2B Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² Π±Π΅Π· Ρ€ΡƒΡ‡Π½ΠΎΠΉ Ρ€Π°Π·ΠΌΠ΅Ρ‚ΠΊΠΈ.

БрСдняя Π΄Π»ΠΈΠ½Π° - 34K Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ², максимум - 119K.

2. Π‘Ρ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎΠ΅ RL-ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ балансировка Π·Π°Π΄Π°Ρ‡ ΠΈ Adaptive Entropy-Controlled Policy Optimization (AEPO), Ρ‡Ρ‚ΠΎ позволяСт ΡΡ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎ ΠΎΠ±ΡƒΡ‡Π°Ρ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π° Π΄Π»ΠΈΠ½Π½Ρ‹Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡΡ….

3. АрхитСктура с ΠΏΠ°ΠΌΡΡ‚ΡŒΡŽ

Π˜Ρ‚Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½Ρ‹Π΅ обновлСния памяти Π·Π° ΠΏΡ€Π΅Π΄Π΅Π»Π°ΠΌΠΈ ΠΎΠΊΠ½Π° 256K Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ².

Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ - +9.48 Π±Π°Π»Π»Π° Π½Π° Π·Π°Π΄Π°Ρ‡Π°Ρ… с контСкстом ΠΎΡ‚ 1M Π΄ΠΎ 4M Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ².

QwenLong-L1.5 - это ΠΎΠ΄ΠΈΠ½ ΠΈΠ· самых ΡΠΈΠ»ΡŒΠ½Ρ‹Ρ… open-source шагов Π² сторону Ρ€Π΅Π°Π»ΡŒΠ½ΠΎ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠ³ΠΎ Ρ€ΠΈΠ·ΠΎΠ½ΠΈΠ½Π³Π° с Π΄Π»ΠΈΠ½Π½Ρ‹ΠΌ контСкстом

МодСль интСрСсна Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°ΠΌΠΈ, Π½ΠΎ ΠΈ Ρ‚Π΅ΠΌ, Ρ‡Ρ‚ΠΎ вСсь стСк обучСния ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚.

GitHub: https://github.com/Tongyi-Zhiwen/Qwen-Doc

Paper: https://modelscope.cn/papers/2512.12967

Model: https://modelscope.cn/models/iic/QwenLong-L1.5-30B-A3B

HF: https://huggingface.co/Tongyi-Zhiwen/QwenLong-L1.5-30B-A3B

@machinelearning

#AI, #LLM, #opensource, #long #Owen

-2
-3