На прошлой неделе китайский стартап Z.ai выпустил GLM-5.1 в открытый доступ — и модель, судя по первым отзывам, реально делает то, о чём говорили уже года три: работает автономно весь рабочий день. Ну и конечно звучит как маркетинг. Но здесь есть цифры. В одном из тестов GLM-5.1 получила задачу: оптимизировать базу данных для быстрого поиска. Не написать файл, не поправить баг — полностью переработать архитектуру. Модель прогнала 655 итераций, совершила больше шести тысяч действий и ускорила систему в шесть раз. Claude Opus и GPT-5.4 за один сеанс до такого не добрались. Штука вот в чём: GLM умеет сама себя перезапустить. Понять, что текущий подход зашёл в тупик, и попробовать принципиально другой. Примерно как джун, который после десятого часа отладки вдруг понимает, что надо было переписать всё с нуля с самого начала. Только без нытья в чат. SWE-Bench Pro тестирует на реальных багах из живых GitHub-репозиториев. GLM-5.1 набрала 58,4 балла, GPT-5.4 — 57,7, Claude Opus — 57,3. Разрыв н
GLM-5.1: открытая китайская модель, которая обогнала GPT и Claude и работает без присмотра восемь часов
7 апреля7 апр
59
2 мин