Z.ai представила GLM-4.7 — значительное обновление своей модели для кодинга. Основной упор сделан на агентные сценарии, работу в терминале и стабильность при решении сложных задач. Результаты бенчмарков демонстрируют существенный прогресс: SWE-bench Verified — 73.8% (+5.8%), SWE-bench Multilingual — 66.7% (+12.9%), Terminal Bench 2.0 — 41% (+16.5%). Ключевое нововведение GLM-4.7 — улучшенное мышление. Модель использует interleaved thinking (обдумывает каждое действие) и сохраняет логику рассуждений между шагами в агентных сценариях. Это повышает стабильность при выполнении длинных цепочек команд в терминале и IDE, снижая вероятность потери контекста и повторения одних и тех же действий. Улучшена работа с инструментами. На τ²-bench и в браузерных задачах модель показывает значительный прирост, что подтверждается практическим применением: меньше ненужных вызовов, больше осмысленных действий. Одновременно улучшены математические способности и сложные рассуждения — на HLE с инструментами G