GLM-4.5 - новая модель для сложных задач, в том числе программирования и работы с инструментами. В ней 355 миллиардов параметров, рабочей частью из них являются 32 миллиарда. Есть версия GLM-4.5-Air: 106 миллиардов параметров, из них используются 12 миллиардов. Оба варианта умеют хорошо рассуждать и использовать внешние инструменты, причем у GLM-4.5 контекст - до 128,000 токенов. В тестах модель заняла третье место среди аналогов, а по задачам с агентами (например, автоматическое выполнение сложных инструкций) показала результат на уровне Claude 4 Sonnet. В тесте на веб-поиск точность - 26.4%, лучше Claude-4-Opus (18.8%), но чуть ниже o4-mini-high (28.3%). GLM-4.5 также круто пишет код: в тесте SWE-bench Verified у нее 64.2%, а в конкурента GPT-4.1 - 48.6%. В задачах на сложные вычисления и логические рассуждения тоже хорошие показатели, например, в AIME24 - 91%. Модель может создавать не только обычный код, но и полноценные сайты, игровые прототипы и презентации, а также успешно с
GLM-4.5 - новая модель для сложных задач, в том числе программирования и работы с инструментами
31 июля 202531 июл 2025
18
1 мин