Исследователи Microsoft представили новую искусственную интеллектуальную (ИИ) систему, способную ставить диагнозы точнее, чем врачи-люди. Система, получившая название Microsoft AI Diagnostic Orchestrator (MAI-DxO), включает несколько моделей ИИ и специальную структуру, позволяющую анализировать симптомы и историю болезни пациента, чтобы предлагать соответствующие обследования. На основе результатов система предлагает возможные диагнозы. Технологический гигант из Редмонда подчеркнул, что, помимо точности диагностики, система также обучена выбирать экономически эффективные методы обследования.
Microsoft разработала специальный тест для оценки эффективности MAI-DxO. Генеральный директор Microsoft AI Мустафа Сулейман в своём посте в X назвал эту систему «большим шагом к медицинскому суперинтеллекту». По его словам, ИИ способен решать некоторые из самых сложных медицинских случаев в мире с более высокой точностью и меньшими затратами по сравнению с традиционными методами диагностики.
Как поясняется в блоге компании, MAI-DxO имитирует виртуальную группу врачей с разными подходами к диагностике, которые совместно работают над решением медицинских случаев. Система включает мультиагентную структуру: один агент выдвигает гипотезу, другой выбирает анализы, два других обеспечивают проверку и контроль, а последний оспаривает гипотезу. Если гипотеза проходит проверку, ИИ-система может либо задать уточняющий вопрос, либо назначить дополнительные анализы, либо поставить диагноз, если информации достаточно. При рекомендации анализов система проводит анализ затрат, чтобы общая стоимость оставалась разумной. Примечательно, что система работает с любыми сторонними моделями ИИ.
Microsoft утверждает, что MAI-DxO повышает точность диагностики всех протестированных моделей ИИ. Однако лучше всего показала себя модель OpenAI o3, правильно решившая 85,5% сложных случаев из базы New England Journal of Medicine (NEJM). Эти же случаи были предложены 21 практикующему врачу из США и Великобритании с опытом работы от 5 до 20 лет — их точность составила лишь 20%.
Компания также отметила, что MAI-DxO можно настроить на работу в рамках заданных бюджетных ограничений. После ввода бюджета система анализирует соотношение стоимости и ценности при постановке диагноза, что позволяет назначать только необходимые анализы, а не все возможные для исключения всех причин симптомов.
Для оценки ИИ-системы Microsoft разработала новый тест под названием Sequential Diagnosis Benchmark (SD Bench). В отличие от стандартных медицинских тестов с вопросами и вариантами ответов, этот тест проверяет способность ИИ последовательно задавать правильные вопросы и назначать нужные анализы, а затем сравнивает результаты с опубликованными в NEJM.
Важно отметить, что MAI-DxO пока не одобрена для клинического использования и представляет собой лишь начальный этап исследований в области диагностики с помощью ИИ. Microsoft подчеркнула, что система может быть допущена к применению в медицине только после тщательных испытаний на безопасность, клинической валидации и регуляторных проверок.