139,7 тыс подписчиков

Google Med-Gemini превзошел другие модели ИИ и профессиональных врачей

8 мая 20248 мая 2024

2 мин

Компания Google представила Med-Gemini - семейство мультимодальных (многомодальных; текстовых, визуальных и т. д.) моделей, построенных на базе Gemini и предназначенных специально для сферы здравоохранения. Хотя модели еще не доступны для публичного или бета-тестирования, технологический гигант опубликовал подробную исследовательскую работу на сайте arXiv. Подробные примеры и сравнения показывают, что Google Med-Gemini превосходит другие ИИ и реальных врачей.

На подходе медицинский искусственный интеллект

Каждый день врачи-люди лечат множество пациентов с различными потребностями и методами лечения. Для оптимального лечения врачам необходимо знать предыдущие истории болезни своих пациентов. Они также должны быть знакомы с текущими методами лечения. Кроме того, существуют отношения между врачом и пациентом. Одним словом, быть врачом - профессия не из легких. С другой стороны, пересечение искусственного интеллекта и медицины развивается довольно быстро. Последний пример тому - Google Med-Gemini, семейство передовых моделей искусственного интеллекта, специализирующихся на медицине.

Источник: ru.freepik.com / Автор: freepik

Примечательной особенностью Google Med-Gemini является возможность работы с длинным контекстом, что позволяет лучше обрабатывать медицинские записи и научные статьи. Эта возможность длинного контекста позволяет моделям делать последовательные выводы из больших объемов данных, таких как часы видео или десятки часов аудио. Кроме того, все модели ИИ являются мультимодальными: они могут выдавать текст, изображения и видео.

Как следует из названия, семейство Med-Gemini основано на существующих моделях Gemini, но с изменениями, ориентированными на медицину. В семейство Med-Gemini входят четыре различные модели: Med-Gemini-S 1.0, Med-Gemini-M 1.0, Med-Gemini-L 1.0 и Med-Gemini-M 1.5.

В Med-Gemini компания Google включила доступ к веб-поиску для улучшения клинической оценки. Кроме того, Med-Gemini обучается на MedQA - вопросах с несколькими вариантами ответов, представляющих собой вопросы американского экзамена на получение медицинской лицензии (USMLE) и предназначенных для проверки медицинских знаний и суждений.

Превосходит GPT-4 по всем критериям

Med-Gemini удалось превзойти GPT-4, самое продвинутое семейство OpenAI, по всем 14 протестированным медицинским критериям. В 10 из этих критериев ему удалось получить наивысшую оценку. Это означает, что человеческие врачи были превзойдены. Сообщается, что Med-Gemini-L 1.0 превосходит своего предшественника Med-PaLM 2 на 4,5 % с точностью 91,1 % на экзамене MedQA (USMLE).

Med-Gemini также превзошел GPT-4 в среднем на 44,5 % в 7 мультимодальных сравнениях, включая NEJM, который включает изображения сложных клинических случаев, диагностированных из списка десяти. Med-Gemini также преуспел в скрининге в MIMIC-III, большой общедоступной базе деидентифицированных медицинских данных пациентов, поступивших в отделение интенсивной терапии. Информация в этих историях болезни может быть очень длинной. Кроме того, есть факторы, увеличивающие количество ошибок, такие как опечатки и сокращения. Несмотря на это, модель успешно справилась с поставленными задачами.

По мнению ученых, в своем нынешнем виде Med-Gemini является «многообещающим» исследованием. Хотя в реальных тестах она может точно соответствовать требованиям пациентов и врачей, исследователи подчеркивают, что необходима дополнительная работа. Однако признают, что даже в своем нынешнем виде машина может обеспечить врачам значительную экономию времени.