ИИ всё ещё плох в роли врача Первое исследование опубликовано в журнале JAMA Network Open. Авторы решили проверить не просто угадывают ли современные ИИ диагноз, а насколько они способны «мыслить» как врач на раннем этапе, когда информации мало и нужно проводить дифференциальную диагностику. Для взяли 21 модель (включая самые известные чат-боты) и прогнали их через клинические сценарии, имитирующие реальные обращения пациентов с симптомами. Оказалось, что именно на этом этапе ИИ чаще всего даёт сбой: более чем в 80% случаев модели неправильно формировали список возможных причин заболевания или упускали критически важные варианты. При этом, когда им уже предоставляли более полные данные (результаты анализов, визуализацию и уточнённую клиническую картину) точность резко возрастала, иногда до вполне конкурентного уровня. В общем, проблема не столько в (не)способности ИИ распознавать известные паттерны, сколько в умении работать с неопределённостью и пошагово сужать круг гипотез, как это