444 подписчика

Новое исследование изучило, как большие языковые модели работают в различных медицинских контекстах, включая реальные случаи в отделениях

3 дня назад3 дня назад

1 мин

неотложной помощи, — и, по крайней мере, одна модель оказалась точнее, чем врачи-люди. В одном из экспериментов исследователи сосредоточились на 76 пациентах, поступивших в отделение неотложной помощи, сравнивая диагнозы, поставленные двумя врачами-терапевтами, с диагнозами, сгенерированными моделями OpenAI o1 и 4o. На каждом этапе диагностики o1 либо номинально превосходил, либо показывал результаты наравне с двумя лечащими врачами и 4o, говорится в исследовании, добавляя, что различия «были особенно заметны на первом этапе диагностики (первичная сортировка в приемном отделении), где имеется наименьшее количество информации о пациенте и наибольшая срочность в принятии правильного решения». Хорошо? Еще как. Однако. В своем посте об исследовании Кристен Пантагани, врач отделения неотложной помощи, сказала, что это «интересное исследование ИИ, которое привело к некоторым сильно преувеличенным заголовкам», особенно потому, что в нем сравнивались диагнозы ИИ с диагнозами врачей-терапевто

Новое исследование изучило, как большие языковые модели работают в различных медицинских контекстах, включая реальные случаи в отделениях неотложной помощи, — и, по крайней мере, одна модель оказалась точнее, чем врачи-люди. В одном из экспериментов исследователи сосредоточились на 76 пациентах, поступивших в отделение неотложной помощи, сравнивая диагнозы, поставленные двумя врачами-терапевтами, с диагнозами, сгенерированными моделями OpenAI o1 и 4o. На каждом этапе диагностики o1 либо номинально превосходил, либо показывал результаты наравне с двумя лечащими врачами и 4o, говорится в исследовании, добавляя, что различия «были особенно заметны на первом этапе диагностики (первичная сортировка в приемном отделении), где имеется наименьшее количество информации о пациенте и наибольшая срочность в принятии правильного решения».

Хорошо? Еще как. Однако. В своем посте об исследовании Кристен Пантагани, врач отделения неотложной помощи, сказала, что это «интересное исследование ИИ, которое привело к некоторым сильно преувеличенным заголовкам», особенно потому, что в нем сравнивались диагнозы ИИ с диагнозами врачей-терапевтов, а не врачей отделения неотложной помощи. «Если мы собираемся сравнивать инструменты ИИ с клиническими способностями врачей, нам следует начать со сравнения с врачами, которые действительно практикуют данную специальность», — сказала Пантагани. «Я бы не удивилась, если бы LLM смог победить дерматолога на экзамене по нейрохирургии, [но] это не особенно полезная информация».

Разработка

• В исследовании ИИ показал более точные диагнозы в приемном отделении скорой помощи, чем два врача

• When ‘if’ slows you down, avoid it

Маркетинг

• Как монетизировать пет-проект: документы, платежи, касса

Кроссплатформа

• Вредные советы для Flutter-разработчика

• Почему animated SVG не работает во Flutter «как в браузере» — и как я попытался это исправить

• Running Gemma 4 E4B on a phone — open-source Flutter toolkit

​Новое исследование изучило, как большие языковые модели работают в различных медицинских контекстах, включая реальные случаи в отделениях

Новое исследование изучило, как большие языковые модели работают в различных медицинских контекстах, включая реальные случаи в отделениях