ИИ обгоняет врачей в неотложке: модели рассуждения приближаются к клинической практике

ВчераВчера

2 мин

Ключевое отличие таких систем — способность к многошаговому рассуждению. В отличие от классических LLM вроде GPT-4, модель анализирует несколько гипотез, проверяет их и корректирует вывод перед финальным ответом. Это приближает её к клиническому мышлению, где диагноз формируется через последовательное исключение альтернатив. В контролируемых тестах на базе клиникопатологических кейсов из New England Journal of Medicine модель достигла точности около 89% для правильного или близкого диагноза, тогда как GPT-4 показал около 73%. Особенно заметен разрыв на сложных случаях — редких инфекциях, аутоиммунных заболеваниях и кардиологических патологиях. Наиболее показательной стала проверка в условиях, пр

Искусственный интеллект делает заметный шаг от лабораторных тестов к реальной медицине. Новое исследование показало, что модель класса reasoning — OpenAI o1-preview — в ряде сценариев не только сопоставима с врачами, но и превосходит их при диагностике пациентов в отделениях неотложной помощи.

Ключевое отличие таких систем — способность к многошаговому рассуждению. В отличие от классических LLM вроде GPT-4, модель анализирует несколько гипотез, проверяет их и корректирует вывод перед финальным ответом. Это приближает её к клиническому мышлению, где диагноз формируется через последовательное исключение альтернатив.

В контролируемых тестах на базе клиникопатологических кейсов из New England Journal of Medicine модель достигла точности около 89% для правильного или близкого диагноза, тогда как GPT-4 показал около 73%. Особенно заметен разрыв на сложных случаях — редких инфекциях, аутоиммунных заболеваниях и кардиологических патологиях.

Наиболее показательной стала проверка в условиях, приближенных к реальности. В 70 кейсах из отделений неотложной помощи модель превзошла врачей на ранней стадии — при триаже, где критически важно быстро определить приоритетный диагноз пациента при дефиците информации. Более того, в «слепой» оценке эксперты не смогли стабильно отличить выводы ИИ от решений клиницистов.

При этом исследование подчёркивает: речь не идёт о замене врачей. Диагностика — лишь часть клинической практики, которая включает физический осмотр, коммуникацию с пациентом и принятие этических решений. Кроме того, модель работала исключительно с текстовыми данными, тогда как реальная медицина опирается на визуальные, аудиальные и поведенческие признаки.

Следующий этап — переход к мультимодальным системам, таким как Gemini 3.1 Pro и новые поколения моделей OpenAI, способных анализировать изображения, звук и видео. Это потенциально приближает ИИ к полноценной клинической среде, но требует строгих испытаний.

Эксперты, включая исследователей из Университет Флиндерса, отмечают: демонстрация высокой точности в тестах — лишь первый шаг. Для внедрения в здравоохранение необходимы клинические испытания, оценка безопасности, устойчивости к ошибкам и отсутствия системных предвзятостей.

Фактически отрасль входит в новую фазу: ИИ уже способен усиливать принятие решений в самых сложных и неопределённых сценариях. Однако главный вопрос смещается с «насколько точен ИИ» к «насколько безопасно и корректно он интегрируется в клиническую практику».

Источник: https://singularityhub.com/2026/05/04/an-ai-just-beat-doctors-at-diagnosing-er-patients/
Больше интересного – на медиапортале https://www.cta.ru/

Гаджеты и электроника

5,73 млн интересуются