Найти в Дзене
Social Mebia Systems

Новый SOTA-модель от Mistral AI: Magistral — инновации, вопросы и сравнения

11 июня 2025 года компания Mistral AI, которую часто называют «европейским OpenAI», представила свой первый крупный продукт в области генеративного ИИ — модель Magistral. Однако, несмотря на амбициозные заявления, запуск вновь вызвал волну критики в сообществе: почему в сравнительных тестах снова нет свежих результатов Qwen и DeepSeek R1?

Magistral: что нового?

Magistral — это новая линейка моделей, ориентированных на прозрачное и объяснимое многоязычное рассуждение. В отличие от предыдущих релизов Mistral (например, Ministral 3B/8B), где компания утверждала о превосходстве над конкурентами, но избегала прямых сравнений с Qwen2.5, в этот раз ситуация повторилась: в официальных бенчмарках отсутствуют актуальные данные по Qwen и последней версии DeepSeek R1 (0528), хотя именно эти модели сейчас считаются одними из самых сильных на рынке.

Например, в тесте AIME-25 по математике DeepSeek-R1-0528 уже достиг точности 87,5% (против 70% ранее), но в сравнительных таблицах Mistral AI фигурируют только устаревшие результаты. Qwen вообще не упоминается.

Тем не менее, по сравнению с собственной предыдущей моделью Mistral Medium 3, новая Magistral Medium показала прирост точности на AIME-24 сразу на 50%.

Два варианта Magistral

Magistral вышла в двух версиях:

  • Magistral Small — открытая модель с 24 миллиардами параметров, распространяется под лицензией Apache 2.0 и может быть развернута самостоятельно.
  • Magistral Medium — более мощная корпоративная версия, доступная через Amazon SageMaker.

Прозрачность и многоязычность

Одна из ключевых особенностей Magistral — поддержка многоязычного рассуждения. Как отметил CEO Mistral AI Артур Менш, исторически американские модели лучше справляются с английским, а китайские — с китайским языком. Magistral же призвана устранить этот разрыв и обеспечить высокое качество рассуждений на европейских языках.

Модель умеет объяснять свои шаги на языке пользователя, что особенно важно для сложных логических задач и многошаговых рассуждений. В демонстрациях показаны примеры работы на арабском языке, а также физические симуляции (например, моделирование гравитации и столкновений), где Magistral Medium не просто выдает ответ, а сопровождает его логикой и объяснениями.

Кроме того, в чате Le Chat с помощью функции Flash Answers Magistral Medium обрабатывает токены в 10 раз быстрее большинства конкурентов, что позволяет реализовать масштабируемое и практически мгновенное взаимодействие.

Инновации в обучении: чистый RL и новая архитектура

Magistral — первая крупная модель Mistral, полностью обученная с нуля с помощью чистого обучения с подкреплением (RL), без использования данных дистилляции с других моделей (в отличие от DeepSeek-R1, где применялась предварительная SFT-настройка).

В основе лежит усовершенствованный алгоритм Group Relative Policy Optimization (GRPO), который позволил повысить точность на AIME-24 с 26,8% до 73,6%. Важные технические новшества включают асинхронную распределённую архитектуру обучения (генераторы и тренеры работают параллельно), динамическую оптимизацию батчей и отказ от KL-пенализации.

Интересно, что команда обнаружила: чистое RL-обучение на текстах также улучшает мультимодальные способности (например, на MMMU-Pro-Vision точность выросла на 12%), а для относительно небольших моделей (24B) Magistral Small достигла 70,7% точности на AIME-24.

Почему нет сравнения с Qwen и DeepSeek R1?

Официальные материалы Mistral AI не содержат прямых сравнений с последними версиями Qwen и DeepSeek R1, что вызвало недовольство в сообществе. Независимые тесты показывают, что Qwen 4B по качеству близка к Magistral, а 30B MoE и свежий R1 заметно опережают новинку от Mistral.

-2

Кроме того, компанию критикуют за то, что она становится всё менее «открытой» — бывший CEO Stability AI даже призвал Mistral сделать ставку на настоящую open-source стратегию, чтобы сохранить лидерство в сообществе.

Итоги

Magistral — это важный шаг для европейского ИИ, модель демонстрирует ряд технологических инноваций и делает акцент на прозрачности и многоязычности. Однако отсутствие открытых сравнений с сильнейшими конкурентами и вопросы к политике открытости Mistral AI пока не позволяют назвать Magistral безоговорочным лидером рынка.

Ссылки для подробностей:
Официальный анонс Mistral
Обсуждение в X (Twitter)
Комментарий CEO Mistral

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/