Я люблю нейросети. Но уже честно устал от одинаковых анонсов: «Новая модель! Она лучше всех! Ну прям совсем!»
28 июля 2025 Z.ai выкатили свою GLM-4.5 — и тут я сначала тоже скептически хмыкнул. А потом начал читать. И, блин, не так уж и зря они всё это пишут.
GLM-4.5 — не просто ещё одна LLM. Это гибридная модель, которая умеет решать, кодить, работать с агентами и — внимание — включать мозги, когда надо. У неё есть «thinking mode» и «non-thinking mode». То есть, она умеет как быстро отвечать на простое, так и копать глубже, если задача того требует.
📌 Каждый день я разбираю новые ИИ-инструменты, сравниваю и тестирую. Подпишись, если хочешь быть в курсе реально полезных моделей, а не только хайпа.
Что это вообще за зверь?
GLM-4.5 (и её «лёгкая» версия Air) — это флагманские модели с 355B и 106B параметрами соответственно. Но не все активны сразу — включаются по мере задачи (MoE-архитектура). Это значит: и быстро, и экономно, и без деградации качества.
Z.ai явно ориентируются на тренд агентных систем. Модель не просто болтает, а умеет планировать, вызывать функции, ходить по сайтам и решать сложные цепочки задач.
Где использовать?
- Reasoning: решает логические и научные задачи, математику (98% на MATH 500 — это почти потолок)
- Coding: не просто «напиши мне функцию», а «построй целый фуллстек-проект от фронта до деплоя»
- Агентные штуки: от web-browsing до function calling — как у лучших моделей, только работает (в 90,6% случаев вызов функции успешен)
И если ты работал с Claude или GPT-4 в кодовых агентах — GLM-4.5 уже интегрируется в Claude Code, CodeGeex, OpenRouter и другие среды.
Чем она меня зацепила
Во-первых, она опенсорсная — модели доступны на HuggingFace и ModelScope. Хочешь — ставь локально, хочешь — вызывай через API. Не надо платить $20 за абонемент.
Во-вторых, гибкость. У тебя есть простая задача? Она не включает Thinking Mode, чтобы не тормозить. А если задача сложная — сама переходит в глубокий режим. Без скриптов, без ручной настройки.
Что по тестам?
- Агентные задачи: почти на уровне Claude 4 Sonnet
- BrowseComp: обходит Claude-4-Opus
- Reasoning: стабильно в топ-3 по MMLU, AIME, GPQA и прочим
- Coding: 64.2% по SWE-bench Verified (у GPT-4.1 — 48.6%)
Словом: она не просто где-то в середине, а стабильно среди лучших по почти всем задачам.
Как попробовать?
- Локально: через vLLM или SGLang, веса на HuggingFace
Реально ли использовать в работе?
Да. Вот прямо сейчас. Особенно, если тебе нужно:
- писать код и деплоить быстро
- строить агентов, ассистентов, ботов с ИИ (например, в Telegram)
- делать слайды и лендинги (да, она умеет в PPT и HTML)
У меня уже стоит локально. И знаешь, приятно, когда ты не завязан на OpenAI, а можешь запускать сильную модель у себя на машине — хоть без интернета.
Ещё будет
Я сейчас гоняю GLM-4.5 в связке с n8n и Telegram — строю на ней бота, для личной продуктивности, с интеграцией GLM-4.5 внутри. Скоро покажу, как это сделать. Подпишись, чтобы не пропустить.
📌 В этом канале — честные обзоры ИИ-моделей и автоматизации. Без магии, по фактам. Каждый день.
Если уже пробовал GLM — напиши, какой юзкейс зашёл больше всего. Сравним опыт 😌