Китайская компания Zhipu AI представила GLM-5V-Turbo — свою первую мультимодальную базовую модель для задач программирования. Модель обрабатывает изображения, видео и текст и рассчитана на агентные сценарии работы. По заявлению компании, GLM-5V-Turbo должна сократить разрыв между визуальным пониманием и генерацией кода. Модель анализирует дизайн-макеты и сразу создает исполняемый код. В Z.AI утверждают, что она напрямую подключается к агентам вроде Claude Code и OpenClaw и поддерживает полный цикл: понимание среды, планирование действий и выполнение задач. Контекстное окно составляет 200 тыс. токенов, а максимальный объем ответа — 128 тыс. токенов. Модель поддерживает режим рассуждения, потоковый вывод, вызов функций… Подробнее