Представьте, что вы приходите к врачу, а он вместо осмотра вводит вашу историю болезни в компьютер и через секунду выдаёт: "С вероятностью 73% у вас разовьётся диабет через 5 лет, артрит — через 8, а вот инфаркт маловероятен". Фантастика? Уже нет. Международная команда учёных создала ИИ-модель, которая предсказывает развитие более тысячи заболеваний на десятилетия вперёд. И делает это пугающе точно.
Исследование, опубликованное в журнале Nature, представляет модель Delphi-2M — своего рода цифрового оракула, только вместо дельфийских жриц у нас 2,2 миллиона параметров нейросети. Название выбрано не случайно: как древний оракул предсказывал судьбу, так и эта модель пытается заглянуть в медицинское будущее человека.
Как научить компьютер читать болезни как книгу
Методология исследования изящна, как движения кота, крадущегося к миске с кормом. Учёные взяли архитектуру GPT (да-да, родственника того самого ChatGPT) и научили её понимать не слова, а болезни.
Вот как это работает:
- Каждое заболевание представлено как "токен" — единица информации
- История болезни человека — это последовательность таких токенов во времени
- Модель учится предсказывать, какой "токен" появится следующим
- Учитывается не только что было, но и когда это происходило
Обучение проводилось на данных UK Biobank — это 402 799 британцев со всей их медицинской историей. Для проверки использовали данные почти 2 миллионов датчан. Согласитесь, выборка посерьёзнее, чем "британские учёные изучили 10 человек".
Числа, которые впечатляют (или пугают)
Модель показала среднюю точность предсказания (AUC) 0,76 для следующего заболевания. Для сравнения: подбрасывание монетки даёт 0,5, а идеальное предсказание — 1,0.
Самые точные предсказания:
- Смерть — AUC 0,97 (да, модель предсказывает и это) 💀
- Сердечно-сосудистые заболевания — AUC 0,70
- Деменция — AUC 0,81
- Различные виды рака — от 0,65 до 0,85
Что особенно интересно: модель понимает временные зависимости. Например, она "знает", что рак поджелудочной повышает риск смерти в 19 раз, а последующий диагноз самого рака увеличивает этот риск в 10 000 раз. При этом влияние инфаркта на смертность практически исчезает через 5 лет — организм либо восстанавливается, либо... ну, вы поняли.
Заглядываем в чёрный ящик
Обычно нейросети — это чёрные ящики: данные входят, предсказания выходят, а что происходит внутри — загадка покруче кошачьей логики. Но исследователи применили метод SHAP (объяснимый ИИ), чтобы понять, как модель принимает решения.
Выяснилось несколько любопытных вещей:
Болезни одной системы предсказывают друг друга. Если у вас проблемы с пищеварением, модель ожидает новых проблем именно там.
Психические расстройства создают устойчивые паттерны коморбидности, которые сохраняются годами.
Болезни, связанные с беременностью, влияют на прогнозы только в течение 5 лет (логично, но приятно, что ИИ это понял).
Некоторые заболевания работают как "красные флаги". Сепсис, например, резко повышает краткосрочные риски, но если вы пережили первый год — можете выдохнуть.
Синтетические пациенты: когда реальность уже не нужна
Самая футуристичная часть исследования — генерация полностью синтетических медицинских историй. Модель может создать виртуального пациента с рождения до смерти, и эта история будет статистически неотличима от реальной.
Исследователи даже обучили новую версию Delphi только на синтетических данных. Результат? AUC 0,74 — всего на 3% хуже оригинала. Это означает, что скоро студенты-медики смогут учиться на виртуальных пациентах, не нарушая ничью приватность. Хотя Я, как учёный кот предпочёл бы, чтобы ветеринары тренировались на виртуальных котах, а не на настоящих. 🐾
Ложка дёгтя в бочке с данными
Но не спешите бежать к компьютеру за диагнозом. У модели есть серьёзные ограничения:
Смещение выборки. UK Biobank — это в основном белые британцы среднего класса 40-70 лет. Молодёжь, пожилые люди и представители других этносов представлены слабо.
Эффект здорового добровольца. В исследовании участвовали относительно здоровые люди — те, кто дожил до момента набора участников. Все, кто умер молодым, автоматически исключены.
Возрастные ограничения. После 80 лет предсказания становятся ненадёжными — слишком мало данных.
Что это значит для медицины будущего
Delphi-2M — это не замена врачу, а скорее супер-калькулятор рисков. Представьте: доктор вводит вашу историю болезни и сразу видит персонализированную карту рисков на годы вперёд. Это поможет:
- Раньше начинать скрининги для групп риска
- Персонализировать профилактику
- Планировать ресурсы здравоохранения
- Мотивировать пациентов менять образ жизни ("Видите эту красную полоску? Это ваш риск диабета, если продолжите есть по ночам")
Этические мурчания напоследок 🐱
Конечно, есть вопросы посерьёзнее технических. Хотите ли вы знать, что через 15 лет у вас с вероятностью 60% разовьётся болезнь Альцгеймера? Как это повлияет на страховки? Не начнут ли работодатели требовать "справку от ИИ" при приёме на работу?
И главное: модель обучена на данных конкретных популяций. Применять её к другим группам — всё равно что использовать британскую кулинарную книгу для приготовления борща. Вроде ингредиенты те же, но результат может удивить.
Взгляд в будущее
Исследователи уже работают над улучшениями. Планируют добавить генетические данные, результаты анализов, данные с фитнес-трекеров. Представьте: ваши умные часы фиксируют изменение пульса, отправляют данные в модель, та пересчитывает риски и предупреждает: "Срочно к кардиологу!"
Может, это и есть будущее медицины — персонализированное, предсказуемое, превентивное. Правда, пока это будущее говорит с британским акцентом и лучше всего понимает проблемы людей среднего возраста. Но начало положено.
Так что в следующий раз, когда услышите "ИИ заменит врачей", можете с умным видом заметить: "Ну, пока что он только научился предсказывать болезни британских пенсионеров с точностью 76%. До полной замены врачей ещё далеко". И добавьте загадочно: "Хотя для предсказания смерти точность уже 97%..."
А как думаете вы — нужны ли нам такие предсказания? Или лучше жить в блаженном неведении, как кот, не подозревающий о визите к ветеринару?