📰 Z.ai нейросеть GLM 5.2: открытые веса, 753 млрд параметров и адовый дроп на GPT-5.5

СегодняСегодня

2 мин

Азиатские нейросети продолжают наводить шороху. Сегодня Z.ai (бывшая Zhipu AI) выкатила GLM-5.2 — это 753 миллиарда параметров чистой мощи, открытые веса и нацеленность на то, чтобы рвать автономное программирование и многозадачную инженерию. Модель уже доступна на Hugging Face, через API Z.ai и в более чем 20 средах разработки. И да, у неё стабильный контекст в 1 миллион токенов. Enterprise-подписка стартует от смешных $12.60 в месяц. Но главное: Z.ai отдала веса под открытой лицензией MIT, так что бери, донашивай, кастомизируй и запускай локально — плати только за электричество. И это очень кстати, потому что американские проприетарные монстры вроде Claude Fable 5 попали под экспортные ограничения Трампа и теперь вообще недоступны. Для тех, кто принимает решения в IT, GLM-5.2 — это путь к размещению AI уровня фронтьера у себя на серверах, в обход любых географических блокировок. IndexShare: меньше вычислений, больше смысла Под капотом GLM-5.2 — 753 миллиарда параметров и архитектур

IndexShare: меньше вычислений, больше смысла

Под капотом GLM-5.2 — 753 миллиарда параметров и архитектурная оптимизация IndexShare. В стандартных гигантах пересчёт внимания на длинных документах жрёт вычислительные ресурсы безбожно. IndexShare решает проблему: один и тот же индексатор используется через каждые четыре разреженных слоя внимания. При максимальном контексте в 1 млн токенов это снижает FLOPs на токен в 2.9 раза. Ещё модель получила улучшенный слой Multi-Token Prediction для спекулятивного декодирования — длина принятых токенов увеличивается до 20% во время инференса. И бонус: Z.ai внедрила гибкие режимы мышления. Можно переключать между «Max» — выжать максимум логики, и «High» — баланс между производительностью и задержками. Идеально для чувствительных к таймингу приложений.

Бенчмарки: открытая модель наступает на пятки закрытым гигантам

На стандартных тестах GLM-5.2 обходит почти все открытые флагманы, включая DeepSeek V4, и вплотную подбирается к закрытым монстрам — GPT-5.5 и Claude Opus 4.8. Особенно силён GLM-5.2 в агентном использовании инструментов и долгоживущих инженерных задачах. Вот ключевые цифры:

— SWE-bench Pro: 62.1 — уверенно бьёт GPT-5.5 (58.6) и предшественника GLM-5.1 (58.4). — FrontierSWE (долгоживущие задачи): 74.4% — выше GPT-5.5 (72.6%) и почти вровень с Claude Opus 4.8 (75.1%). — MCP-Atlas (использование инструментов): 77.0 — обходит GPT-5.5 (75.3) и совсем чуть-чуть отстаёт от Claude Opus 4.8 (77.8). — Humanity's Last Exam (с инструментами): 54.7 — впереди GPT-5.5 (52.2) и плотно за Claude Opus 4.8 (57.9). — PostTrainBench и SWE-Marathon (многочасовые инженерные нагрузки): 34.3% против 25.0% у GPT-5.5 на первом, 13.0% против 12.0% на втором. — Terminal-Bench 2.1: 81.0 — уступает Claude Opus 4.8 (85.0) и GPT-5.5 (84.0), но бьёт Google Gemini 3.1 Pro (74.0). — Design Arena (краудсорсинговый дизайн): первое место с ELO 1360, обогнав даже Claude Fable 5.

Заметно, как работают режимы мышления: на «Max» модель выдаёт почти 85 тыс. токенов на задачу, на «High» — вдвое меньше при минимальной потере качества. Отличный рычаг для приложений, где критична задержка.

API и тарифные планы: Z.ai не жадничает

Z.ai запустила GLM Coding Plan — набор для разработчиков, а не просто чат-интерфейс. Из коробки поддерживаются Claude Code, OpenClaw, Cline, Kilo Code, Crush, Factory и другие. При ежегодной оплате цены такие:

— Lite: $12.60/мес (со второго года $151....

🔗 Полный текст статьи читайте у нас на сайте: Читать на TechLoot

📢 ТехноЛут