83 подписчика

Xiaomi выпустила революционные MiMo-V2.5 и V2.5-Pro: открытые модели, которые переигрывают закрытые системы конкурентов

28 апреля28 апр

5 мин

Прямой ответ: Xiaomi выпустила две открытые языковые модели MiMo-V2.5 и V2.5-Pro под лицензией MIT. Модели демонстрируют лучшую производительность на аgentic задачах при меньшем расходе токенов и значительно более низкой цене (40 центов за входящие токены против 17,50$ у GPT и 30$ у Claude Opus). Представь: китайская компания, знаменитая смартфонами и электромобилями, вдруг выпускает одни из самых мощных открытых языковых моделей на планете. И не просто выпускает, а ещё и делает их доступнее, чем закрытые решения от Google и OpenAI. Звучит как сумма? Но это именно то, что произошло с новыми Xiaomi MiMo-V2.5 и MiMo-V2.5-Pro. Обе модели выпущены под лицензией MIT — это настоящий золотой стандарт для разработчиков. Никаких ограничений на коммерческое использование, никаких запросов разрешений. Ты просто качаешь модель с Hugging Face, запускаешь локально или в облаке — и готово. Это реально меняет игру. Следи за новостями в сфере AI, подписавшись на Telegram-канал ProAi, где я делюсь опыто

Оглавление

Xiaomi выпустила революционные MiMo-V2.5 и V2.5-Pro: открытые модели, которые переигрывают закрытые системы конкурентов
Чем они лучше? Токены и деньги
Две модели — две стратегии

Xiaomi выпустила революционные MiMo-V2.5 и V2.5-Pro: открытые модели, которые переигрывают закрытые системы конкурентов

Прямой ответ: Xiaomi выпустила две открытые языковые модели MiMo-V2.5 и V2.5-Pro под лицензией MIT. Модели демонстрируют лучшую производительность на аgentic задачах при меньшем расходе токенов и значительно более низкой цене (40 центов за входящие токены против 17,50$ у GPT и 30$ у Claude Opus).

Представь: китайская компания, знаменитая смартфонами и электромобилями, вдруг выпускает одни из самых мощных открытых языковых моделей на планете. И не просто выпускает, а ещё и делает их доступнее, чем закрытые решения от Google и OpenAI. Звучит как сумма? Но это именно то, что произошло с новыми Xiaomi MiMo-V2.5 и MiMo-V2.5-Pro.

Обе модели выпущены под лицензией MIT — это настоящий золотой стандарт для разработчиков. Никаких ограничений на коммерческое использование, никаких запросов разрешений. Ты просто качаешь модель с Hugging Face, запускаешь локально или в облаке — и готово. Это реально меняет игру. Следи за новостями в сфере AI, подписавшись на Telegram-канал ProAi, где я делюсь опытом работы с новыми AI моделями и LLM.

Чем они лучше? Токены и деньги

Вот что меня удивило больше всего. По бенчмарку ClawEval — это когда система самостоятельно выполняет задачи, как помощник — MiMo-V2.5-Pro занимает почти первое место среди открытых моделей. Успешность: 63,8%. И при этом потребляет примерно 70 тысяч токенов на одну последовательность задач.

Для сравнения: Claude Opus, Gemini 3.1 Pro и GPT-5.4 требуют на 40-60 процентов больше токенов для того же результата. Это означает одно: твоя рука экономит деньги. Особенно важно сейчас, когда все крупные сервисы переходят на оплату за каждый токен. Помнишь времена, когда платил раз в месяц и юзал сколько хочешь? Те времена уходят.

Две модели — две стратегии

Xiaomi выпустила не одну, а две версии. MiMo-V2.5 — это универсал, умеет работать с текстом, звуком и видео сразу (мультимодальность, короче). MiMo-V2.5-Pro — это специалист по сложным задачам, ориентирован на агентов и долгие цепочки операций.

Про Pro стоит рассказать подробнее. Архитектура: 1,02 триллиона параметров, но активны только 42 миллиарда. Это как больница со множеством врачей, но для каждого пациента вызывают только нужных специалистов. Умно, да?

И вот что получилось на практике. Модель собрала компилятор на Rust с нуля — лексер, парсер, backend на RISC-V — за 4,3 часа. Это задача, которая обычно отнимает у студента-программиста несколько недель. При этом результат был идеальным: 233 из 233 баллов на скрытых тестах.

В другом эксперименте: модель создала полноценный видеоредактор с многодорожечной временной шкалой за 11,5 часов. Почти 1900 вызовов инструментов, более 8 тысяч строк кода. Это реально работает.

Цены, которые смущают конкурентов

Теперь про деньги. MiMo-V2.5-Pro за границей стоит доллар за миллион входящих токенов. За пределами контекста 256K — два доллара. С кешированием входящих токенов цена падает до 20-40 центов. Это нормально для такой производительности.

Базовая модель V2.5 — ещё дешевле. Всего 40 центов на входе, два доллара на выходе. Посмотри на таблицу конкурентов: GPT-5.4 стоит 17,50 доллара за миллион токенов, Claude Opus — 30 долларов. MiMo в три раза выгоднее.

А ещё Xiaomi сделала кеширование бесплатным (ограниченно), свободно отдаёт текст-в-речь (TTS). Токен-план стартует с 63 доллара в год на 720 миллионов кредитов. Для тех, кто работает с агентами, это просто манна небесная.

Почему это имеет значение прямо сейчас

Индустрия ломается прямо у нас на глазах. GitHub анонсировал, что Copilot полностью перейдёт на оплату по токенам. Microsoft, OpenAI, Google — все движутся в одну сторону: от подписок к счётчикам. Разработчики уже ворчат, что платят столько же, а получают меньше.

MiMo приходит в этот момент как спасение. Открытая, потому что MIT License — настоящая свобода. Эффективная, потому что разреженная архитектура (Sparse Mixture-of-Experts) работает умнее. И дешёвая, потому что Xiaomi не нужна SaaS-подписка, им нужны пользователи их экосистемы. Если тебе нужны мощные инструменты для работы с международными сервисами AI, рекомендую Zarub — сервис для оплаты зарубежных AI-подписок из России.

Как это работает под капотом

MiMo-V2.5 проходит пять этапов обучения: предварительная подготовка на 48 триллионах токенов, выравнивание мультимодальных кодировщиков, скейлинг, расширение контекстного окна до миллиона токенов, и наконец — обучение с подкреплением.

Pro-версия тренировалась иначе. Не на восприятии, а на «пространстве действий». Модель училась управлять собственной памятью, поддерживать логику через тысячи последовательных вызовов инструментов. Это называется «harness awareness» — осознанность относительно своих инструментов.

В архитектуре внимания Pro использует соотношение 7:1 (раньше было 5:1). То есть модель просто «пробегает» большую часть контекста, но очень внимательно смотрит на 15 процентов, которые релевантны. Это критично для отладки больших кодовых репозиториев или для инженерных задач высокого уровня сложности.

Что дальше

Модель вышла с поддержкой SGLang и vLLM — двух популярнейших движков для быстрого вывода. Можешь запустить на облачных H100, на китайских ускорителях, на чем угодно. Xiaomi раздаёт 100 триллионов бесплатных токенов разработчикам, чтобы люди пробовали.

Фули Луо, ведущий проекта (раньше работал в DeepSeek), сказал: ценность модели измеряется не рейтингом, а проблемами, которые она решает. Команда уже работает на следующую версию — с ещё более глубокими рассуждениями и лучшим понимаем реальности.

Для кого это важно

Если ты энтерпрайз и хочешь избежать закрытых систем с растущими платежами — скачивай веса и запускай локально. Если ты разработчик, который строит агентов — пробуй, на тебя ждёт 100T бесплатных токенов. Если тебе нужна предсказуемая цена без «контекстного налога» — MiMo тебе в руки.

Это не просто обновление модели. Это заявление о независимости от закрытых лабораторий. Xiaomi доказала: разрыв между открытым сообществом и корпоративными исследовательскими центрами фактически закрыт. Дальше будет только интереснее.