24 подписчика

GLM-4.7: Новый уровень AI для кодинга от Z.ai

22 декабря 202522 дек 2025

1 мин

Z.ai представила GLM-4.7 — значительное обновление своей модели для кодинга. Основной упор сделан на агентные сценарии, работу в терминале и стабильность при решении сложных задач. Результаты бенчмарков демонстрируют существенный прогресс: SWE-bench Verified — 73.8% (+5.8%), SWE-bench Multilingual — 66.7% (+12.9%), Terminal Bench 2.0 — 41% (+16.5%). Ключевое нововведение GLM-4.7 — улучшенное мышление. Модель использует interleaved thinking (обдумывает каждое действие) и сохраняет логику рассуждений между шагами в агентных сценариях. Это повышает стабильность при выполнении длинных цепочек команд в терминале и IDE, снижая вероятность потери контекста и повторения одних и тех же действий. Улучшена работа с инструментами. На τ²-bench и в браузерных задачах модель показывает значительный прирост, что подтверждается практическим применением: меньше ненужных вызовов, больше осмысленных действий. Одновременно улучшены математические способности и сложные рассуждения — на HLE с инструментами G

Результаты бенчмарков демонстрируют существенный прогресс: SWE-bench Verified — 73.8% (+5.8%), SWE-bench Multilingual — 66.7% (+12.9%), Terminal Bench 2.0 — 41% (+16.5%).

Ключевое нововведение GLM-4.7 — улучшенное мышление. Модель использует interleaved thinking (обдумывает каждое действие) и сохраняет логику рассуждений между шагами в агентных сценариях. Это повышает стабильность при выполнении длинных цепочек команд в терминале и IDE, снижая вероятность потери контекста и повторения одних и тех же действий.

Улучшена работа с инструментами. На τ²-bench и в браузерных задачах модель показывает значительный прирост, что подтверждается практическим применением: меньше ненужных вызовов, больше осмысленных действий. Одновременно улучшены математические способности и сложные рассуждения — на HLE с инструментами GLM-4.7 достигает 42.8%, что почти на 12 пунктов выше предыдущей версии.

Приятным бонусом стало улучшение генерации пользовательского интерфейса и “vibe coding”. Модель создает более аккуратные веб-страницы с адекватной версткой, размерами и визуальной иерархией, что экономит время при создании быстрых прототипов и внутренних инструментов.

GLM-4.7 уже интегрирована в популярные агентные среды (Claude Code, Roo Code, Cline и др.), доступна через API Z.ai и OpenRouter, а веса модели опубликованы и могут быть развернуты локально через vLLM или SGLang. Стоимость позиционируется как конкурентоспособная — “уровень Claude по более низкой цене”, что делает её привлекательной для постоянных агентных задач.

Ну что ж, похоже, теперь даже искусственный интеллект будет делать вид, что он понимает, что делает, и генерировать код, который хотя бы выглядит профессионально. Остается надеяться, что он не начнет требовать кофе и печеньки.