11 подписчиков

🔥 Xiaomi MiMo-V2-Flash: 309B MoE монстр, который ЛЕТАЕТ!

23 декабря 202523 дек 2025

1 мин

73.4% SWE-Bench (лучше DeepSeek-V3 671B!). 309B параметров, 15B активных, 150 t/s, 256K контекст. Бесплатный Claude Sonnet 4.5 уровень — как запустить в Cursor? (see the generated image above) *** Xiaomi не шутит: MiMo-V2-Flash рвёт чарты 16 декабря 2025 Xiaomi сбросила MiMo-V2-Flash — MoE-гиганта с 309B общими параметрами, 15B активных. Не "ещё одна модель", а SOTA кодер 2025: Бенчмарки (реальные): - SWE-Bench Verified: 73.4% (DeepSeek-V3 671B: ~70%) - AIME 2025 (математика): 94.1% (топ-2 open-source) - GPQA-Diamond: Топ-2 среди открытых - LiveBench: 5-е место глобально Ключевое: 15B активных = Claude Sonnet 4.5 мощь, но **150 токенов/сек**! Почему MiMo-V2-Flash = мечта кодера 1. MoE магия: 309B всего, 15B за раз — скорость как у 13B dense 2. Multi-Token Prediction: 3x ускорение (native MTP, не спекулятивка) 3. Hybrid Attention: Sliding Window (128 токенов) + Full (5:1) = 6x меньше KV-cache 4. 256K контекст — весь монолит + доки 5. Agentic RL: 100k+ GitHub issues в post-training Как з

***

Xiaomi не шутит: MiMo-V2-Flash рвёт чарты

16 декабря 2025 Xiaomi сбросила MiMo-V2-Flash — MoE-гиганта с 309B общими параметрами, 15B активных. Не "ещё одна модель", а SOTA кодер 2025:

Бенчмарки (реальные):

- SWE-Bench Verified: 73.4% (DeepSeek-V3 671B: ~70%)

- AIME 2025 (математика): 94.1% (топ-2 open-source)

- GPQA-Diamond: Топ-2 среди открытых

- LiveBench: 5-е место глобально

Ключевое: 15B активных = Claude Sonnet 4.5 мощь, но **150 токенов/сек**!

Почему MiMo-V2-Flash = мечта кодера

1. MoE магия: 309B всего, 15B за раз — скорость как у 13B dense

2. Multi-Token Prediction: 3x ускорение (native MTP, не спекулятивка)

3. Hybrid Attention: Sliding Window (128 токенов) + Full (5:1) = 6x меньше KV-cache

4. 256K контекст — весь монолит + доки

5. Agentic RL: 100k+ GitHub issues в post-training

Как запустить БЕСПЛАТНО

Вариант 1: OpenRouter (лимитировано)

Выбери xiaomi/mimo-v2-flash в Cursor.

Вариант 2: Официальный API (beta)

Регаешься на platform.xiaomimimo.com → получаешь API Key → вставляешь в Cursor как OpenAI-compatible endpoint.

Скорость: 150 t/s (Claude: 40 t/s).

Промпт-фикс (обязательно):

"You are MiMo-V2-Flash by Xiaomi. Expert coder. Production-ready."

MiMo vs Конкуренты (кодинг 2025)

MiMo-V2-Flash: 73.4% SWE-Bench, 150 t/s, $0

GPT-5.1 High: 78%, 120 t/s, $60/млн

Claude Sonnet 4.5: 72%, 80 t/s, $75/млн

DeepSeek-V3: 70%, 100 t/s, $10/млн

MiMo выигрывает: Скорость + цена + open-source.

Минусы:

- Tool calling сырой (фиксится промптом)

- Нет llama.cpp (пока)

- Китайский bias (промпт решает)

Стек = MiMo-V2-Flash + Cursor

256K контекст + 150 t/s = enterprise MVP за вечер. Забудь про счета за Claude.

На ближайших скринкастах: Покажу, как работает свой LLM-прокси для MiMo с патчами, повышающими стабильность её работы. Полный пайплайн: кодинг → деплой → тесты в реальной работе.

Подписывайся на мой телеграм канал — код, гайды, live-кодинг! 🔥

Вопросы:
- MiMo тестили? 73% SWE-Bench реально?
- Claude или MiMo?
- 150 t/s подтвердилось?