Добавить в корзинуПозвонить
Найти в Дзене

GLM-5.1: открытая китайская модель, которая обогнала GPT и Claude и работает без присмотра восемь часов

На прошлой неделе китайский стартап Z.ai выпустил GLM-5.1 в открытый доступ — и модель, судя по первым отзывам, реально делает то, о чём говорили уже года три: работает автономно весь рабочий день. Ну и конечно звучит как маркетинг. Но здесь есть цифры. В одном из тестов GLM-5.1 получила задачу: оптимизировать базу данных для быстрого поиска. Не написать файл, не поправить баг — полностью переработать архитектуру. Модель прогнала 655 итераций, совершила больше шести тысяч действий и ускорила систему в шесть раз. Claude Opus и GPT-5.4 за один сеанс до такого не добрались. Штука вот в чём: GLM умеет сама себя перезапустить. Понять, что текущий подход зашёл в тупик, и попробовать принципиально другой. Примерно как джун, который после десятого часа отладки вдруг понимает, что надо было переписать всё с нуля с самого начала. Только без нытья в чат. SWE-Bench Pro тестирует на реальных багах из живых GitHub-репозиториев. GLM-5.1 набрала 58,4 балла, GPT-5.4 — 57,7, Claude Opus — 57,3. Разрыв н
Оглавление

На прошлой неделе китайский стартап Z.ai выпустил GLM-5.1 в открытый доступ — и модель, судя по первым отзывам, реально делает то, о чём говорили уже года три: работает автономно весь рабочий день.

Восемь часов — это не метафора

Ну и конечно звучит как маркетинг. Но здесь есть цифры.

В одном из тестов GLM-5.1 получила задачу: оптимизировать базу данных для быстрого поиска. Не написать файл, не поправить баг — полностью переработать архитектуру. Модель прогнала 655 итераций, совершила больше шести тысяч действий и ускорила систему в шесть раз. Claude Opus и GPT-5.4 за один сеанс до такого не добрались.

Штука вот в чём: GLM умеет сама себя перезапустить. Понять, что текущий подход зашёл в тупик, и попробовать принципиально другой. Примерно как джун, который после десятого часа отладки вдруг понимает, что надо было переписать всё с нуля с самого начала. Только без нытья в чат.

На бенчмарках — выше флагманов

SWE-Bench Pro тестирует на реальных багах из живых GitHub-репозиториев. GLM-5.1 набрала 58,4 балла, GPT-5.4 — 57,7, Claude Opus — 57,3. Разрыв небольшой, но открытая модель от стартапа обошла флагманы именно там, где это сложнее всего накрутить цифрами.

Сколько стоит

Через API — около 1,40 доллара за миллион входящих токенов и 4,40 за исходящие. Дешевле Claude Haiku. GPT-5.4 Pro стоит в 35 раз больше — на случай, если тебе нужна точка отсчёта.

Подписка: базовый план 27 долларов в квартал, средний — 81, максимальный — 216. Z.ai утверждает, что базовый даёт в три раза больше использования, чем Claude Pro.

Но: в пиковые часы по пекинскому времени квота расходуется втрое быстрее. Сейчас это покрывает промоакция, потом — нет. Обнаружишь, скорее всего, по счёту, а не заранее.

Кому попробовать

Если работаешь с Claude Code, Cursor или похожими инструментами — GLM-5.1 подключается к Cline, Roo Code и стандартным оболочкам без лишних настроек.

Один из пользователей написал, что задача на неделю — препроцессинг данных, подбор параметров, итерации — заняла два дня. Это звучит как обычный отзыв, только без привычной оговорки «при условии что я постоянно рядом сидел».

Модель не генерирует код и не ждёт, пока ты посмотришь. Запускает, смотрит на результат, находит проблему, исправляет, проверяет снова — сотни раз, пока задача не решена. Или пока не кончится квота, но это уже другая история.

Открытая — но не вся

GLM-5.1 вышла под MIT-лицензией: скачивай, дорабатывай, коммерческое использование разрешено. Параллельно Z.ai выпустила GLM-5 Turbo — более быструю версию — и она закрытая. Флагман отдали сообществу, оптимизированную версию оставили за деньги.

Собственно, именно так это и работает — тут нет никакой интриги. Вопрос только в том, что именно достаётся бесплатно. И GLM-5.1 в открытом доступе — уже неплохой ответ.

ИИ-рынок три года мерился тем, кто выдаёт лучший ответ за один промпт. GLM-5.1 играет по-другому: не один блестящий ход, а восемь часов монотонной, никем не прерываемой работы. Как подрядчик, который не берёт трубку, пока не сдаст объект.

Ты уже пробовал отдавать агенту задачу на несколько часов без присмотра — и что из этого получилось?

Занимаюсь внедрением ИИ для бизнеса. Детали — в
телеграме.