11 августа Baichuan Intelligent представила Baichuan‑M2 — открытый медицинский модель-ускоритель рассуждений на 32 млрд параметров, специально спроектированный для реальных клинико-диагностических задач.
На эталоне HealthBench модель не только обошла свежий открытый 120‑миллиардный gpt‑oss‑120b от OpenAI, но и заняла первое место среди open‑source, став, по состоянию на 10 августа 2025 года, наиболее близким к GPT‑5 по медицинским возможностям открытым решением.
Новый ориентир для «ИИ‑врача»
Baichuan‑M2 — вторая медицинская «усиленная» открытая модель компании, с акцентом на мыслительные цепочки и клинико-коммуникационные навыки. На HealthBench (5000 многораундовых диалогов «врач‑пациент», оценка по 48 562 правилам, составленным 262 врачами) она опередила ряд сильнейших открытых моделей, включая gpt‑oss‑120b, Qwen3‑235B‑A22B‑Thinking‑2507, DeepSeek‑R1‑0528, GLM‑4.5, Kimi‑K2.
Особенно заметен отрыв на треке HealthBench Hard, где проверяются сложные клинические сценарии и устойчивость рассуждений.
По данным разработчика, M2 показывает сопоставимость и даже превосходство над рядом закрытых моделей последнего поколения: на HealthBench/Hard она обходит o3, Grok 3, Gemini 2.5 Pro, GPT‑4.1, а «планку в 32+ балла» делит только с GPT‑5.
При этом за счёт умеренного размера параметров модель дешевле в развёртывании, что, по сути, «сдвигает вперёд Парето‑границу» между качеством и стоимостью по сравнению с gpt‑oss‑120b.
Ключевой практический плюс — лучшая клиническая адаптация к локальным реалиям. Пример: для 55‑летнего пациента с первичным раком печени Baichuan‑M2, ссылаясь на рекомендации НКЗ Китая, предлагает анатомическую правостороннюю гемигепатэктомию — решение, соответствующее клингайдлайнам. В то же время gpt‑oss‑120b склоняется к TACE, опираясь на шкалу BCLC, что показывает расхождение с местной практикой.
Технический прорыв: «симулятор пациента» и верифицируемое обучение с подкреплением
Задача медИИ не сводится к извлечению фактов: реальные диалоги полны шумов, неполных описаний, когнитивных искажений. Разработчики Baichuan ответили на это двумя системными инновациями.
Во‑первых, «симулятор пациента» — построенный на реальных кейсах генеративный стенд, создающий десятки тысяч профильных пациентов разных возрастов, пола, симптоматики и стилистики речи. Он позволяет прогонять миллионы «визитов», где ИИ сталкивается с натуральной вариативностью выражений, недосказанностью и ошибками, а не с «чистыми» учебными примерами.
Во‑вторых, верифицируемый контур RL: динамические критерии оценки формируются по ходу интеракции, что переводит обучение от статических «правил награды» к живой системе проверки гипотез и стратегий.
В результате M2 умеет выбирать, когда углублять сбор анамнеза дополнительными вопросами, а когда — уверенно формулировать заключение и план, исходя из достаточности данных.
Эта связка — симулятор + верифицируемый RL — и стала основой перехода от Baichuan‑M1‑14B к качественно более сильному Baichuan‑M2.
Зачем это рынку: от «модели как сервиса» к «двойной медицине»
Дефицит квалифицированных врачей — структурная проблема. В видении Baichuan выход — «двойной врач»: каждому клиницисту — ИИ‑медассистент; каждому пациенту — персональный ИИ‑доктор, непрерывно сопровождающий и накапливающий индивидуальные данные здоровья.
Для такого сценария критичны приватность и приватное развёртывание: компактность и открытость M2 упрощают локальную установку в больницах и управлениях здравоохранения, что подтверждают уже идущие сотрудничества с Пекинской детской больницей, Третьей больницей Пекинского университета и Хайдяньским комитетом по здравоохранению.
Мировая гонка медИИ: окно возможностей
Пока американские лидеры (OpenAI, Anthropic) наращивают общую мощность (MoE‑архитектуры, маршрутизация, новые метрики), разрыв в «универсальном ИИ» может сохраняться или расти. Зато вертикаль здравоохранения становится новой главной трассой: на презентации GPT‑5 особый акцент сделан именно на медицине; доля медИИ среди новых «единорогов» США в 2025 году превысила 50% (Abridge, OpenEvidence, Hippocratic AI и др.).
На фоне тезисов Билла Гейтса о «демократизации экспертизы» и оценки Джеффри Хинтона о революционном эффекте для науки и здравоохранения, быстрый ответ Baichuan на открытие gpt‑oss‑120b — в виде M2, вышедшего через пять дней и показавшего лучшую оценку на HealthBench, — демонстрирует, что в медИИ Китай уже идёт вровень с мировыми вершинами.
Что дальше
Ближайшая повестка — репликации результатов в клинике, расширение проверок на редкие заболевания и пограничные случаи, а также создание безопасных, объяснимых интерфейсов «врач‑ИИ‑пациент». Если траектория сохраняется, «ИИ‑врач» перестанет быть метафорой: при открытой базе, уместном размере и качественном контуре верификации Baichuan‑M2 уже выглядит как рабочий кандидат в новую инфраструктуру цифрового здравоохранения — более быструю, доступную и устойчивую к перегрузкам.
Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.
ИИ сегодня — ваше конкурентное преимущество завтра!
Тел. +7 (985) 982-70-55
E-mail sms_systems@inbox.ru