Компания Xiaomi выпустила свою первую большую языковую модель — MiMo-7B, которая уже доступна для всех на платформах Hugging Face и GitHub. Это компактная нейросеть с 7 миллиардами параметров, разработанная специально для решения логических задач и анализа кода. По производительности она сравнима с моделью o1-mini от OpenAI, но требует значительно меньше ресурсов и может работать локально. Разработка MiMo велась новой командой внутри Xiaomi. Модель обучалась в два этапа. Сначала ее научили базовым навыкам анализа текста, рассуждению и обработке данных — получилась версия MiMo-7B-Base. Затем ее дообучили на задачах по программированию и математике, используя специально подготовленный датасет из 130 тысяч заданий. Во время обучения модель обработала примерно 25 триллионов токенов. Такой подход — сначала научить рассуждать, а потом погрузить в профильные знания — позволил добиться высокой точности без увеличения размера модели. Инженеры Xiaomi подчеркивают, что большинство открытых моделе
Китайский ответ OpenA – Xiaomi выпустила ИИ-модель MiMo
30 апреля 202530 апр 2025
1 мин