117 подписчиков

Китайцы выпустили крошечную open-source модель, которая уделывает Qwen. Как им это удалось?

2 июня2 июн

3 мин

Вы любите истории про «мал золотник, да дорог»? Потому что сейчас будет именно такая. Команда OpenBMB выкатила MiniCPM5-1B. И нет, это не очередная «модель для энтузиастов, которая никому не нужна». Это реальный удар по рынку компактных LLM. Почему удар? Сейчас объясню без излишнего фанатизма. Что такое MiniCPM5-1B и почему о ней говорят Это языковая модель с 1 миллиардом параметров. Звучит скромно, когда вокруг все обсуждают семи- и тринадцатимиллиардные гиганты. Но создатели сделали две правильные вещи. Первое. Они выложили всё в полный open-source. Веса, код для деплоя, даже обучающие данные. Бесплатно, без регистрации и смс. Это серьёзный шаг, потому что многие китайские модели формально open-source, а по факту что-то прячут. Второе. Модель реально умная. Настолько, что становится неловко перед конкурентами. Цифры, которые всё объясняют Бенчмарк Artificial Analysis (это такой рейтинг, которому в индустрии доверяют) поставил MiniCPM5-1B на первое место среди всех моделей размером до

Вы любите истории про «мал золотник, да дорог»? Потому что сейчас будет именно такая.

Команда OpenBMB выкатила MiniCPM5-1B. И нет, это не очередная «модель для энтузиастов, которая никому не нужна». Это реальный удар по рынку компактных LLM.

Почему удар? Сейчас объясню без излишнего фанатизма.

Что такое MiniCPM5-1B и почему о ней говорят

Это языковая модель с 1 миллиардом параметров. Звучит скромно, когда вокруг все обсуждают семи- и тринадцатимиллиардные гиганты. Но создатели сделали две правильные вещи.

Первое. Они выложили всё в полный open-source. Веса, код для деплоя, даже обучающие данные. Бесплатно, без регистрации и смс. Это серьёзный шаг, потому что многие китайские модели формально open-source, а по факту что-то прячут.

Второе. Модель реально умная. Настолько, что становится неловко перед конкурентами.

Цифры, которые всё объясняют

Бенчмарк Artificial Analysis (это такой рейтинг, которому в индустрии доверяют) поставил MiniCPM5-1B на первое место среди всех моделей размером до 2 миллиардов параметров.

Счёт: 17.9 балла.

Теперь держитесь за стул. Qwen3.5-2B – модель в два раза больше – набрала 16.3 балла. То есть меньше, а весит больше. Как так вышло – загадка. Но факт остаётся фактом: китайцы сделали что-то с архитектурой, что позволяет крошке быть умнее толстяка.

В тестах на логику, математику, программирование и работу с внешними инструментами MiniCPM5-1B также оставляет позади Qwen3.5-0.8B и LFM2.5-1.2B-Thinking. Без вариантов.

Почему размер имеет значение (и здесь он играет на руку)

Самое интересное начинается, когда вы смотрите на квантованную версию INT4. Она весит… 0.5 гигабайта.

Полгигабайта. Это меньше, чем одна фотография с современного смартфона, если снимать в RAW. Это меньше, чем большинство мобильных игр.

Что это значит на практике? А вот что.

Вы можете запустить эту модель локально на смартфоне. Прямо на процессоре, без интернета, без облаков, без задержек. Можете встроить её в браузерное расширение. Можете поставить на какое-нибудь edge-устройство вроде умной камеры или датчика.

Раньше для этого приходилось брать модели с 0.5 миллиарда параметров, которые соображали так себе. Теперь есть полноценная рабочая лошадка с приличным интеллектом, которая помещается в карман.

Вишенка на торте, от которой немного взрывается мозг

Отдельного внимания заслуживает фреймворк ForgeTrain. Именно на нём обучали MiniCPM5-1B.

Чем он уникален? ForgeTrain – первый в индустрии production-grade фреймворк для претрейна LLM, который полностью написан нейросетью. Без участия человека-программиста. Вообще ни одного.

Нейросеть написала код, который обучил другую нейросеть. Которая теперь делает стыдно модели от крупных компаний.

При этом ForgeTrain работает на 10% быстрее NVIDIA Megatron. То есть фреймворк, созданный ИИ, оказался эффективнее того, что написала команда инженеров из NVIDIA.

Это либо гениально, либо немного пугающе. Наверное, и то и другое.

Есть ли подвох? Скорее всего да

Бенчмарки – это бенчарки, а реальная жизнь – другое. Модель может отлично справляться с абстрактными задачками, но на реальных данных, с шумом и неоднозначностями, рассыпаться.

Плюс поддержка open-source сообществом. Выложить код и веса – половина дела. Вторая половина – чтобы энтузиасты начали это всё обновлять, фиксить баги и адаптировать под разные задачи. Покажет время.

Но сам факт: 1 миллиард параметров, 0.5 ГБ в кванте, обгон Qwen – это уже достижение. И игнорировать его не получится.

Вопрос к тем, кто возится с open-source LLM

Как вы считаете, это начало тренда на сверхкомпактные, но умные модели? Или MiniCPM5-1B останется уникальным экспериментом, который никто не повторит?

Пробовали уже запускать её локально? Насколько больно было настроить и какие результаты на реальных задачах?

И вопрос шире: доверяете ли вы фреймворкам, написанным нейросетями? Или пока считаете это опасным экспериментом?

Ставьте лайк, если тема open-source ИИ вам небезразлична. И подписывайтесь – в следующих постах разберём, можно ли встроить эту крошку в реальный бизнес-процесс или это только для энтузиастов.

Жду ваши впечатления в комментариях. Кто уже успел скачать и потестить – отписывайтесь. Интересно, насколько она хороша не в бенчмарках, а в настоящем бою.