Популярные чат-боты не пригодны для замены консультации врача — более чем в 80 % случаев они ставят неверный диагноз при ограниченном наборе информации. К такому выводу пришли авторы исследования, сообщило Financial Times. В ходе эксперимента специалисты использовали 29 описаний клинических случаев из справочной медицинской литературы. Моделям поэтапно передавались данные, включая историю болезни, результаты осмотров и лабораторных анализов. Чат-ботам задавались вопросы на тему диагностики заболеваний, после чего измерялась точность и полнота ответов. В выборку проверяемых ИИ-систем вошли два десятка популярных моделей, в том числе разработки OpenAI, Anthropic, Google, xAI и DeepSeek. При передаче ограниченной информации о симптомах большие языковые модели испытывали трудности с выбором возможных диагнозов и чаще всего сводили всё к единственному варианту, на который нельзя полагаться в дальнейшем лечении. Когда входные данные были достаточно подробными, проблемы с постановкой точного
Чат-боты ставят неверный диагноз в 8 случаях из 10, выяснили учёные
14 апреля14 апр
373
1 мин