Перспективы на будущее - два тематических исследования
Существует много направлений, по которым в будущем может происходить развитие машинного обучения в области медицинской диагностики. Некоторые могут полагаться на новые тенденции в компьютерных технологиях или технологии медицинского оборудования, однако, возможно, более важными будут разработка новых алгоритмов машинного обучения и философия медицинской диагностики.
Скажем так, мы не хотим спекулировать на всех возможных трендах. Вместо этого мы описываем два примера, иллюстрирующих новые тенденции в развитии алгоритмов машинного обучения и то, как методика машинного обучения может способствовать возможному изменению философии медицинской диагностики.
Первый кейс-стади описывает недавно разработанный метод работы с достоверностью решений классификаторов, который представляется перспективным для интеллектуального анализа данных в медицине.
Во втором описывается подход к использованию машинного обучения для проверки некоторых необъяснимых явлений в комплементарной медицине, который (пока) не одобрен православным медицинским сообществом, но может в будущем сыграть важную роль в общей медицинской диагностике и лечении.
Установка нового экземпляра в набор учебных материалов
Используя тот или иной метод машинного обучения, мы обычно оцениваем общую надежность метода, как правило, с точки зрения точности классификации, оценки информации (Кононенко и Братко, 1991) или стоимости неправильной классификации (Kukar et al., 1999). Однако, что нас действительно интересует при использовании метода для решения данной проблемы, так это надежность этого метода в данной конкретной задаче. Это также важно, когда мы используем несколько классификаторов и объединяем их решения (Kukar et al., 1996).
В таком случае мы должны взвесить вклад каждого классификатора в принятие окончательного решения. Вес должен зависеть от конкретного случая, т.е. мы должны быть в состоянии оценить надежность каждого метода для данного случая.
Для этого может быть использована простая идея: решение классификатора является надежным в данном случае, когда решение (прогноз, класс, диагноз) не чувствительно к добавлению этого случая, обозначенного тем или иным решением (диагнозом), в обучающий набор.
Проверить надежность можно просто пометив новый кейс всеми возможными решениями, добавив его в набор знаний и повторив алгоритм обучения. Если решение не сильно отличается, мы предполагаем, что классификатор достаточно надежен. С другой стороны, если решения чувствительны к добавлению нового случая в набор знаний, окончательное решение не является надежным.
Кукар (2001) в своей докторской диссертации развил эту базовую идею гораздо глубже. Он разработал несколько показателей для измерения расстояний между классификациями, которые затем используются для измерения вариации классификации. Он сравнил несколько различных оценок надежности и эмпирически показал, что метрика, основанная на скалярном произведении векторов классификации, лучше всего работает в сочетании с вероятностью возникновения проблем после тестирования.
Экспериментальные результаты по 15 областям подтверждают, что оценка надежности единого прогноза дает полезную информацию, которая может быть использована для улучшения общей применимости классификаторов.
Та же идея была использована для взвешенного сочетания ответов нескольких классификаторов. Такой подход повышает точность классификации одного классификатора и значительно улучшает гравировку комбинированного классификатора по отношению к шумным, случайным и стандартным классификаторам.
Эта же идея была также использована для решения проблем, связанных с неоднородной неправильной классификацией расходов.
Для чувствительного к затратам сочетания различных классификаторов, которые сами по себе не обязательно должны быть чувствительными к затратам, были использованы оценки реализуемости, чувствительные к затратам.
Результаты экспериментов показывают значительное снижение общих расходов на неправильную классификацию (Kukar, 2001). Мы недооцениваем полезность подхода к проблеме диагностики ишемического заболевания сердца.
Применение в диагностике ишемической болезни сердца
Ишемическая болезнь сердца является одной из наиболее важных причин смертности в мире, поэтому любые улучшения и рационализация диагностических процедур являются очень полезными.
Четыре диагностических уровня состоят из оценки признаков и симптомов заболевания и ЭКГ (электрокардиограммы) в покое, последовательного тестирования ЭКГ во время контролируемых упражнений, миокарда и наконец коронарной ангиографии.
Диагностический процесс осуществляется поэтапно, и результаты интерпретируются последовательно, т.е. следующий шаг необходим только в том случае, если результаты первого не являются окончательными. В связи с возможной внушаемостью, результаты каждого этапа интерпретируются отдельно, и действительны только результаты самого высокого этапа.
С другой стороны, машинные методы обучения могут быть способны объективно интерпретировать все доступные результаты для одного и того же пациента и таким образом повысить точность диагностики на каждом этапе.
Производительность различных методов диагностики обычно описывается как точность классификации, чувствительность, специфичность, ROC-кривая и вероятность возникновения проблем после теста.
В нашем исследовании мы использовали набор данных 327 пациентов с проведенными клиническими и лабораторными исследованиями, тренировками ЭКГ, миокарда и коронарной ангиографией.
В 229 случаях болезнь была подтверждена с помощью ангиографии, а в 98 случаях - исключена. Пациенты были отобраны из 4000 пациентов, которые в 1991-1994 годах проходили обследование на отделении ядерной медицины Университетского клинического центра в Любляне (Словения).
Положительный и отрицательный диагнозы ишемической болезни сердца считаются надежными, если вероятность наличия или отсутствия заболевания, соответственно, выше 0,90 (Diamond and Forster, 1979).
Для этого для расчета вероятности проведения анализа используются табличные значения, полученные в результате различных диагностических шагов, а также чувствительность и специфичность (Pollock, 1983).