11 июня 2025 года компания Mistral AI, которую часто называют «европейским OpenAI», представила свой первый крупный продукт в области генеративного ИИ — модель Magistral. Однако, несмотря на амбициозные заявления, запуск вновь вызвал волну критики в сообществе: почему в сравнительных тестах снова нет свежих результатов Qwen и DeepSeek R1?
Magistral: что нового?
Magistral — это новая линейка моделей, ориентированных на прозрачное и объяснимое многоязычное рассуждение. В отличие от предыдущих релизов Mistral (например, Ministral 3B/8B), где компания утверждала о превосходстве над конкурентами, но избегала прямых сравнений с Qwen2.5, в этот раз ситуация повторилась: в официальных бенчмарках отсутствуют актуальные данные по Qwen и последней версии DeepSeek R1 (0528), хотя именно эти модели сейчас считаются одними из самых сильных на рынке.
Например, в тесте AIME-25 по математике DeepSeek-R1-0528 уже достиг точности 87,5% (против 70% ранее), но в сравнительных таблицах Mistral AI фигурируют только устаревшие результаты. Qwen вообще не упоминается.
Тем не менее, по сравнению с собственной предыдущей моделью Mistral Medium 3, новая Magistral Medium показала прирост точности на AIME-24 сразу на 50%.
Два варианта Magistral
Magistral вышла в двух версиях:
- Magistral Small — открытая модель с 24 миллиардами параметров, распространяется под лицензией Apache 2.0 и может быть развернута самостоятельно.
- Magistral Medium — более мощная корпоративная версия, доступная через Amazon SageMaker.
Прозрачность и многоязычность
Одна из ключевых особенностей Magistral — поддержка многоязычного рассуждения. Как отметил CEO Mistral AI Артур Менш, исторически американские модели лучше справляются с английским, а китайские — с китайским языком. Magistral же призвана устранить этот разрыв и обеспечить высокое качество рассуждений на европейских языках.
Модель умеет объяснять свои шаги на языке пользователя, что особенно важно для сложных логических задач и многошаговых рассуждений. В демонстрациях показаны примеры работы на арабском языке, а также физические симуляции (например, моделирование гравитации и столкновений), где Magistral Medium не просто выдает ответ, а сопровождает его логикой и объяснениями.
Кроме того, в чате Le Chat с помощью функции Flash Answers Magistral Medium обрабатывает токены в 10 раз быстрее большинства конкурентов, что позволяет реализовать масштабируемое и практически мгновенное взаимодействие.
Инновации в обучении: чистый RL и новая архитектура
Magistral — первая крупная модель Mistral, полностью обученная с нуля с помощью чистого обучения с подкреплением (RL), без использования данных дистилляции с других моделей (в отличие от DeepSeek-R1, где применялась предварительная SFT-настройка).
В основе лежит усовершенствованный алгоритм Group Relative Policy Optimization (GRPO), который позволил повысить точность на AIME-24 с 26,8% до 73,6%. Важные технические новшества включают асинхронную распределённую архитектуру обучения (генераторы и тренеры работают параллельно), динамическую оптимизацию батчей и отказ от KL-пенализации.
Интересно, что команда обнаружила: чистое RL-обучение на текстах также улучшает мультимодальные способности (например, на MMMU-Pro-Vision точность выросла на 12%), а для относительно небольших моделей (24B) Magistral Small достигла 70,7% точности на AIME-24.
Почему нет сравнения с Qwen и DeepSeek R1?
Официальные материалы Mistral AI не содержат прямых сравнений с последними версиями Qwen и DeepSeek R1, что вызвало недовольство в сообществе. Независимые тесты показывают, что Qwen 4B по качеству близка к Magistral, а 30B MoE и свежий R1 заметно опережают новинку от Mistral.
Кроме того, компанию критикуют за то, что она становится всё менее «открытой» — бывший CEO Stability AI даже призвал Mistral сделать ставку на настоящую open-source стратегию, чтобы сохранить лидерство в сообществе.
Итоги
Magistral — это важный шаг для европейского ИИ, модель демонстрирует ряд технологических инноваций и делает акцент на прозрачности и многоязычности. Однако отсутствие открытых сравнений с сильнейшими конкурентами и вопросы к политике открытости Mistral AI пока не позволяют назвать Magistral безоговорочным лидером рынка.
Ссылки для подробностей:
Официальный анонс Mistral
Обсуждение в X (Twitter)
Комментарий CEO Mistral
Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.
ИИ сегодня — ваше конкурентное преимущество завтра!
Тел. +7 (985) 982-70-55
E-mail sms_systems@inbox.ru