Найти Π² Π”Π·Π΅Π½Π΅
PythonTalk

πŸ‡¨πŸ‡³ GLM-4.7: ΠΎΡ‡Π΅Ρ€Π΅Π΄Π½ΠΎΠΉ ΠΊΡ€ΡƒΡ‚ΠΎΠΉ Ρ€Π΅Π»ΠΈΠ· ΠΎΡ‚ ΠΊΠΈΡ‚Π°ΠΉΡ†Π΅Π²

Z.AI (Zhipu AI) Π²Ρ‹ΠΊΠ°Ρ‚ΠΈΠ»ΠΈ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅ своСй флагманской опСнсорс-ΠΌΠΎΠ΄Π΅Π»ΠΈ β€” GLM-4.7. И ΠΏΠΎΠ΄Π²ΠΈΠ½ΡƒΠ»ΠΈ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ ΠΏΡ€ΠΎΠΏΡ€ΠΈΠ΅Ρ‚Π°Ρ€Π½Ρ‹Π΅ LLM 🌝 ΠŸΠΎΡ‡Π΅ΠΌΡƒ стоит ΠΎΠ±Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅? 1️⃣Preserved Thinking (БохраняСмоС ΠΌΡ‹ΡˆΠ»Π΅Π½ΠΈΠ΅) Π­Ρ‚ΠΎ, ΠΏΠΎΠΆΠ°Π»ΡƒΠΉ, главная ΠΊΠΈΠ»Π»Π΅Ρ€-Ρ„ΠΈΡ‡Π° для Π°Π³Π΅Π½Ρ‚Π½ΠΎΠΉ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ. Как Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с Chain-of-Thought? ΠŸΠΎΠ΄ΡƒΠΌΠ°Π»ΠΈ, Π²Ρ‹Π΄Π°Π»ΠΈ ΠΎΡ‚Π²Π΅Ρ‚, ΠΈ Π½Π° ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ шагС Π΄ΠΈΠ°Π»ΠΎΠ³Π° Π·Π°Π±Ρ‹Π»ΠΈ всю Ρ†Π΅ΠΏΠΎΡ‡ΠΊΡƒ рассуТдСний. Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ β€” потСря контСкста ΠΏΡ€ΠΈ слоТных Ρ€Π΅Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΈΠ½Π³Π°Ρ…. GLM-4.7 ΡƒΠΌΠ΅Π΅Ρ‚ ΡΠΎΡ…Ρ€Π°Π½ΡΡ‚ΡŒ thinking blocks ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ…ΠΎΠ΄Π°ΠΌΠΈ. Для Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π² IDE это критичСски Π²Π°ΠΆΠ½ΠΎ: модСль Π½Π΅ тСряСт Π½ΠΈΡ‚ΡŒ Π»ΠΎΠ³ΠΈΠΊΠΈ, ΠΊΠΎΠ³Π΄Π° Π²Ρ‹ проситС ΠΏΠΎΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ Π±Π°Π³ Π² Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‡Ρ‚ΠΎ написанном ΠΊΠΎΠ΄Π΅. 2️⃣ Π‘Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠΈ Π’ ΠΎΡ‚Ρ‡Π΅Ρ‚Π΅ заявлСно, Ρ‡Ρ‚ΠΎ GLM-4.7 Π±ΡŒΠ΅Ρ‚ GPT-5.2 Π² Π²Π΅Π±-Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅. На SWE-bench Verified ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ 73.8% (+5.8% ΠΊ ΠΏΡ€ΠΎΡˆΠ»ΠΎΠΉ вСрсии). На LiveCodeBench β€” 84.9 (open-source SOTA). 3️⃣ Π›ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ запуск МодСль поддСрТиваСтся Π² vLLM ΠΈ SGLang. Для Ρ‚Π΅Ρ…, Ρƒ ΠΊΠΎΠ³ΠΎ паранойя (обоснованная) ΠΏΠΎ ΠΏΠΎΠ²ΠΎΠ΄Ρƒ ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ ΠΊΠΎΠ΄Π° Π² ΠΎΠ±Π»Π°ΠΊΠ°, ΠΈΠ»ΠΈ для энтСрпрайза с Π·Π°ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΌ ΠΊΠΎΠ½Ρ‚ΡƒΡ€ΠΎΠΌ β€” это ΠΌΠ°

πŸ‡¨πŸ‡³ GLM-4.7: ΠΎΡ‡Π΅Ρ€Π΅Π΄Π½ΠΎΠΉ ΠΊΡ€ΡƒΡ‚ΠΎΠΉ Ρ€Π΅Π»ΠΈΠ· ΠΎΡ‚ ΠΊΠΈΡ‚Π°ΠΉΡ†Π΅Π²

Z.AI (Zhipu AI) Π²Ρ‹ΠΊΠ°Ρ‚ΠΈΠ»ΠΈ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅ своСй флагманской опСнсорс-ΠΌΠΎΠ΄Π΅Π»ΠΈ β€” GLM-4.7. И ΠΏΠΎΠ΄Π²ΠΈΠ½ΡƒΠ»ΠΈ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ ΠΏΡ€ΠΎΠΏΡ€ΠΈΠ΅Ρ‚Π°Ρ€Π½Ρ‹Π΅ LLM 🌝

ΠŸΠΎΡ‡Π΅ΠΌΡƒ стоит ΠΎΠ±Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅?

1️⃣Preserved Thinking (БохраняСмоС ΠΌΡ‹ΡˆΠ»Π΅Π½ΠΈΠ΅)

Π­Ρ‚ΠΎ, ΠΏΠΎΠΆΠ°Π»ΡƒΠΉ, главная ΠΊΠΈΠ»Π»Π΅Ρ€-Ρ„ΠΈΡ‡Π° для Π°Π³Π΅Π½Ρ‚Π½ΠΎΠΉ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ.

Как Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с Chain-of-Thought? ΠŸΠΎΠ΄ΡƒΠΌΠ°Π»ΠΈ, Π²Ρ‹Π΄Π°Π»ΠΈ ΠΎΡ‚Π²Π΅Ρ‚, ΠΈ Π½Π° ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ шагС Π΄ΠΈΠ°Π»ΠΎΠ³Π° Π·Π°Π±Ρ‹Π»ΠΈ всю Ρ†Π΅ΠΏΠΎΡ‡ΠΊΡƒ рассуТдСний. Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ β€” потСря контСкста ΠΏΡ€ΠΈ слоТных Ρ€Π΅Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΈΠ½Π³Π°Ρ….

GLM-4.7 ΡƒΠΌΠ΅Π΅Ρ‚ ΡΠΎΡ…Ρ€Π°Π½ΡΡ‚ΡŒ thinking blocks ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ…ΠΎΠ΄Π°ΠΌΠΈ. Для Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π² IDE это критичСски Π²Π°ΠΆΠ½ΠΎ: модСль Π½Π΅ тСряСт Π½ΠΈΡ‚ΡŒ Π»ΠΎΠ³ΠΈΠΊΠΈ, ΠΊΠΎΠ³Π΄Π° Π²Ρ‹ проситС ΠΏΠΎΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ Π±Π°Π³ Π² Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‡Ρ‚ΠΎ написанном ΠΊΠΎΠ΄Π΅.

2️⃣ Π‘Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠΈ

Π’ ΠΎΡ‚Ρ‡Π΅Ρ‚Π΅ заявлСно, Ρ‡Ρ‚ΠΎ GLM-4.7 Π±ΡŒΠ΅Ρ‚ GPT-5.2 Π² Π²Π΅Π±-Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅.

На SWE-bench Verified ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ 73.8% (+5.8% ΠΊ ΠΏΡ€ΠΎΡˆΠ»ΠΎΠΉ вСрсии).

На LiveCodeBench β€” 84.9 (open-source SOTA).

3️⃣ Π›ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΉ запуск

МодСль поддСрТиваСтся Π² vLLM ΠΈ SGLang. Для Ρ‚Π΅Ρ…, Ρƒ ΠΊΠΎΠ³ΠΎ паранойя (обоснованная) ΠΏΠΎ ΠΏΠΎΠ²ΠΎΠ΄Ρƒ ΠΎΡ‚ΠΏΡ€Π°Π²ΠΊΠΈ ΠΊΠΎΠ΄Π° Π² ΠΎΠ±Π»Π°ΠΊΠ°, ΠΈΠ»ΠΈ для энтСрпрайза с Π·Π°ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΌ ΠΊΠΎΠ½Ρ‚ΡƒΡ€ΠΎΠΌ β€” это мастхэв.

МоТно ΠΏΠΎΠ΄Π½ΡΡ‚ΡŒ Π΄ΠΎΠΊΠ΅Ρ€-ΠΊΠΎΠ½Ρ‚Π΅ΠΉΠ½Π΅Ρ€ ΠΈ Π³ΠΎΠ½ΡΡ‚ΡŒ SOTA-ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ Π½Π° своСм ΠΆΠ΅Π»Π΅Π·Π΅ (Ссли VRAM Ρ…Π²Π°Ρ‚ΠΈΡ‚, ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎ).

Π― ΡƒΠΆΠ΅ ΠΊΠ°ΠΊΠΎΠ΅-Ρ‚ΠΎ врСмя тСстировал GLM-4.6 Π² Kilo Code, ΠΆΠ΄Ρƒ ΠΏΠΎΠΊΠ° добавят 4.7, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠΏΡ€ΠΎΠ±ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ±Π½ΠΎΠ²Ρƒ. БСйчас, Π½Π° ΠΌΠΎΠΉ взгляд, это ΠΎΠ΄ΠΈΠ½ ΠΈΠ· Π»ΡƒΡ‡ΡˆΠΈΡ… Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ΠΎΠ² ΠΏΠΎ ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡŽ Ρ†Π΅Π½Π°/качСство. Π”ΠΎΠ»ΠΆΠ½ΠΎ Π±Ρ‹Ρ‚ΡŒ Π½Π° днях.

-2
-3