Найти в Дзене
НейроПульс

GLM-4.5: Новая эра искусственного интеллекта с открытым кодом 🌐

GLM-4.5 — серия передовых моделей искусственного интеллекта, разработанная компанией Z.ai, ранее известной как Zhipu AI. Эти модели, включающие GLM-4.5 и компактную GLM-4.5-Air, представляют собой значительный шаг в развитии агентных систем, сочетая высокую производительность в рассуждении, программировании и обработке сложных задач. Модели основаны на архитектуре Mixture of Experts (MoE), обеспечивающей оптимальное использование вычислительных ресурсов и высокую эффективность. 🚀 Подписывайтесь на мой телеграмм канал - НейроФакт, там я делюсь эксклюзивным контентом про ИИ! Технические характеристики 📊 GLM-4.5 обладает 355 миллиардами параметров, из которых 32 миллиарда активны в процессе обработки. GLM-4.5-Air, более легкая версия, имеет 106 миллиардов параметров, из которых активны 12 миллиардов. Это делает её доступной для работы на потребительских GPU с 32–64 ГБ видеопамяти. Контекстное окно моделей достигает 128 тысяч токенов, что позволяет обрабатывать обширные данные. Обучение

GLM-4.5 — серия передовых моделей искусственного интеллекта, разработанная компанией Z.ai, ранее известной как Zhipu AI. Эти модели, включающие GLM-4.5 и компактную GLM-4.5-Air, представляют собой значительный шаг в развитии агентных систем, сочетая высокую производительность в рассуждении, программировании и обработке сложных задач. Модели основаны на архитектуре Mixture of Experts (MoE), обеспечивающей оптимальное использование вычислительных ресурсов и высокую эффективность. 🚀

Подписывайтесь на мой телеграмм канал - НейроФакт, там я делюсь эксклюзивным контентом про ИИ!

Технические характеристики 📊

GLM-4.5 обладает 355 миллиардами параметров, из которых 32 миллиарда активны в процессе обработки. GLM-4.5-Air, более легкая версия, имеет 106 миллиардов параметров, из которых активны 12 миллиардов. Это делает её доступной для работы на потребительских GPU с 32–64 ГБ видеопамяти. Контекстное окно моделей достигает 128 тысяч токенов, что позволяет обрабатывать обширные данные. Обучение проводилось на 15 триллионах токенов общего назначения и 8 триллионах, ориентированных на программирование и агентные задачи. 🔍

Ключевые возможности 🛠️

Рассуждение: GLM-4.5 занимает третье место среди всех моделей по тестам MMLU, AIME и GPQA, уступая лишь Grok-4 и o3. GLM-4.5-Air лидирует среди моделей с ~100 миллиардами параметров.

Программирование: Модели демонстрируют выдающиеся результаты в создании кода, включая веб-приложения, игры и исправление ошибок, с успешностью использования инструментов 90.6%.

Агентные способности: Поддержка веб-поиска и сложных многоэтапных задач делает GLM-4.5 конкурентоспособной даже по сравнению с Claude 3.5 Sonnet.

Эффективность: Архитектура MoE и интеллектуальное распределение параметров обеспечивают экономичное использование ресурсов.

Доступность и лицензия 📜

Модели распространяются под лицензией MIT, что позволяет свободное коммерческое использование и доработку. GLM-4.5 и GLM-4.5-Air доступны через платформу z.ai, Hugging Face, ModelScope или локально с использованием фреймворков vLLM и SGLang. API предоставляется по цене $0.11 за миллион входных токенов для GLM-4.5-Air.

Применение 🌍

GLM-4.5 идеально подходит для разработки программного обеспечения, создания интерактивных приложений и обработки сложных запросов. Её универсальность и открытость делают модель привлекательной для разработчиков и исследователей.

Подробности: z.ai

GLM-4.5 устанавливает новый стандарт в области ИИ с открытым кодом, обеспечивая баланс между производительностью и доступностью. 💡