Найти в Дзене
Дмитрий Ильин

GLM-5 Turbo: китайская модель для агентов

Ты наверняка видел эту картину: берёшь «умную» модель, просишь её сделать задачу в несколько шагов — найти данные, открыть сервис, что-то посчитать, оформить — и дальше начинается сериал на 12 серий. То инструмент не вызвала, то «ой, я не могу», то на шестом шаге забыла, что было на первом. Вот как раз под такие истории китайский стартап Z.ai (он же бывший Zhipu AI) выкатил GLM‑5‑Turbo — новую версию своего GLM‑5, заточенную не под разговоры, а под «агентскую работу». Но есть нюанс, который разработчики почувствуют сразу: это не open source. Z.ai подаёт GLM‑5‑Turbo как модель для сценариев, где ИИ не просто отвечает, а выполняет цепочку действий: разбивает задачу на шаги, вызывает инструменты, держит контекст, возвращается к задаче позже, работает «по расписанию» и не разваливается посередине длинного процесса. Это попытка сделать ИИ не собеседником, а исполнителем, который умеет доводить дела до конца. Примерно как сотрудник, который не исчезает после фразы «принял в работу». Модель у
Оглавление

Ты наверняка видел эту картину: берёшь «умную» модель, просишь её сделать задачу в несколько шагов — найти данные, открыть сервис, что-то посчитать, оформить — и дальше начинается сериал на 12 серий. То инструмент не вызвала, то «ой, я не могу», то на шестом шаге забыла, что было на первом.

Вот как раз под такие истории китайский стартап Z.ai (он же бывший Zhipu AI) выкатил GLM‑5‑Turbo — новую версию своего GLM‑5, заточенную не под разговоры, а под «агентскую работу». Но есть нюанс, который разработчики почувствуют сразу: это не open source.

Turbo — это не ещё один чатбот

Z.ai подаёт GLM‑5‑Turbo как модель для сценариев, где ИИ не просто отвечает, а выполняет цепочку действий: разбивает задачу на шаги, вызывает инструменты, держит контекст, возвращается к задаче позже, работает «по расписанию» и не разваливается посередине длинного процесса.

Это попытка сделать ИИ не собеседником, а исполнителем, который умеет доводить дела до конца. Примерно как сотрудник, который не исчезает после фразы «принял в работу».

Сколько стоит и где доступен

Модель уже доступна через API у стороннего провайдера OpenRouter.

По ценам заявлено так: $0.96 за миллион входных токенов и $3.20 за миллион выходных. В сумме получается $4.16 за “вход+выход”, что примерно на $0.04 дешевле, чем обычный GLM‑5 (у него около $4.20 при тех же расчётах).

Контекст — огромный (примерно 202.8k токенов), а максимальный вывод — до 131.1k токенов. Это из серии «можно скормить половину корпоративной переписки и ещё останется место для ТЗ».

Скорость: есть интересный подвох

По данным провайдера картина не такая прямолинейная, как слово Turbo в названии. Стартует модель не молниеносно — но дистанцию проходит бодрее конкурентов. Ощущение как у марафонца: со светофора не рвёт, зато финишную ленточку рвёт раньше.

Главное для агентов: меньше ошибок с инструментами

Самый вкусный показатель для тех, кто строит автоматизацию — надёжность вызова инструментов.

У GLM‑5‑Turbo на OpenRouter показан tool call error rate 0.67%. А у GLM‑5 у разных провайдеров — от 2.33% до 6.41%.

Если ты делал агента, который должен открыть календарь, сходить в таблицу и отправить письмо, ты понимаешь разницу между «ошибка инструмента раз в 150 вызовов» и «ошибка раз в 20». В первом случае это автоматизация, во втором — новый питомец, за которым надо присматривать.

Ещё одна точка входа: подписка GLM Coding

Z.ai также добавляет Turbo в свой продукт GLM Coding (кодовый ассистент по подписке). Там три тарифа: Lite, Pro и Max, оплата поквартально (от $27 до $216 за квартал).

По плану компании, пользователи Pro получат Turbo в марте, а Lite подождут до апреля — пока сидят на базовой версии.

Плюс Z.ai собирает заявки на ранний доступ для компаний — типичная история «впустим по очереди, как в хороший ресторан».

Почему всех зацепило не “Turbo”, а лицензия

И вот момент, из-за которого новость реально важнее очередного релиза модели: GLM‑5 был open source (MIT), а GLM‑5‑Turbo — закрытый.

Z.ai формулирует аккуратно: мол, наработки и улучшения из Turbo попадут в будущие открытые релизы. Но это не обещание выложить сам Turbo. Скорее: «секретный соус мы потом попробуем пересказать, но банку не отдадим».

Что это говорит о рынке (и почему это похоже на привычную схему)

Раньше Z.ai много выигрывала за счёт открытости: разработчики пробуют, внедряют, экосистема растёт. Но сейчас всё больше видно общий тренд: открытые модели — для охвата, а самые «денежные» варианты — для корпоративных задач, агентов, кода — могут выходить сначала закрытыми.

Не потому что кто-то внезапно разлюбил open source, а потому что агент, который реально работает в проде, — это уже не игрушка. Там цена ошибки выше, и ценник у продукта тоже.

В итоге GLM‑5‑Turbo выглядит как сигнал: Z.ai всё ещё говорит с рынком языком открытых моделей, но начинает играть по взрослым правилам — где лучшее для автоматизации иногда прячут за API и договором.

И да, получается немного как в жизни: рецепт борща вроде общий, но у бабушки он почему-то всё равно вкуснее — и она не спешит отдавать точные пропорции.