Введение
В статье представлен обзор развития интеллектуального анализа данных в медицине с точки зрения машинного обучения: исторический взгляд, современный взгляд и взгляд на некоторые будущие тенденции в этой области прикладного искусственного интеллекта.
В статье не ставится задача дать исчерпывающий обзор, а скорее описаны некоторые под темы и направления, которые, с моей личной точки зрения, важны для применения машинного обучения в медицинской диагностике.
В историческом обзоре я подчеркиваю наивность Байесовского классификатора. Я представляю сравнение некоторых современных систем, представителей каждой отрасли машинного обучения, при применении к нескольким медицинским диагностическим задачам.
Будущие тенденции иллюстрируются двумя тематическими исследованиями.
В первом описывается недавно разработанный метод работы с надежностью решений классификаторов, который представляется перспективным для интеллектуального анализа данных в медицине.
Другая характеризует подход к использованию машинного обучения с целью проверки некоторых необъяснимых явлений из комплементарной медицины, который (пока) не одобрен православным медицинским сообществом, но может в будущем сыграть важную роль в общей медицинской диагностике и лечении.
Искусственный интеллект
Искусственный интеллект является частью компьютерной науки, которая стремится сделать компьютеры более интеллектуальными. Одним из основных требований к любому разумному поведению является обучение.
Сегодня большинство исследователей сходятся во мнении, что без знаний не бывает интеллекта. Поэтому машинное обучение (Shavlik and Dietterich, 1990; Michie et al., 1994; Mitchell, 1997; Michalski et al., 1998) является одной из основных отраслей искусственного интеллекта и одной из наиболее быстро развивающихся областей исследований ИИ.
Алгоритмы машинного обучения изначально разрабатывались и использовались для анализа наборов медицинских данных.
Сегодня машинное обучение предоставляет несколько незаменимых инструментов для интеллектуального анализа данных. Особенно в последние несколько лет цифровая революция обеспечила относительно недорогие и доступные средства для сбора и хранения данных.
Современные больницы хорошо оснащены средствами мониторинга и другими средствами сбора данных, а данные собираются и передаются в крупные информационные системы.
Технология машинного обучения в настоящее время хорошо подходит для анализа медицинских данных, в частности, проводится большая работа по постановке медицинской диагностики небольших специализированных диагностических задач.
В специализированных больницах или их отделениях данные о правильном диагнозе часто можно получить в виде медицинской карты. Все, что нужно сделать, это ввести в компьютерную программу карты пациентов с известным правильным диагнозом, чтобы запустить алгоритм обучения. Это, конечно, чрезмерное упрощение, но в принципе, медицинские диагностические знания могут быть автоматически получены из описания случаев, разрешенных в прошлом.
Полученные классификаторы могут затем использоваться либо для оказания помощи врачу при диагностике новых пациентов с целью повышения скорости, точности или надежности диагностики, либо для обучения студентов или врачей-неспециалистов диагностировать пациентов по специальным диагностическим проблемам.
Исторический обзор
Как только электронные компьютеры начали использоваться в пятидесятые и шестидесятые годы, были разработаны алгоритмы, позволяющие моделировать и анализировать большие массивы данных.
С самого начала возникли три основных направления машинного обучения. Классическая работа в символическом обучении описана Хантом и др. (1966), в статистических методах Нильссоном (1965) и в нейронных сетях Розенблатом (1962).
На протяжении многих лет все три ветви разрабатывали передовые методы (Michie et al., 1994): статистические методы или методы распознавания образов, такие как k-близкие соседи, дискриминантный анализ и Байесовские классификаторы, индуктивное обучение символическим правилам, таким как нисходящий ввод дерева решений, правила принятия решений и введение логических программ и искусственные нейронные сети, такие как многослойная передняя нейронная сеть с поддержкой распространения знаний, H. Коопередача и самоорганизация сети с поддержкой развития памяти.
Насыщенный байесовский классификатор
Я ограничиваюсь историческим обзором статистических методов простым классификатором Байесейна. С самого начала меня это очень заинтересовало. Алгоритм чрезвычайно прост, но очень мощный, и позже я обнаружил, что он может дать и исчерпывающие объяснения, что было подтверждено в ходе долгих обсуждений с врачами.
Меня поразила его эффективность и способность превосходить самые передовые и сложные алгоритмы при решении многих медицинских и других диагностических задач.
Например, по сравнению с шестью алгоритмами, байесовский классификатор превзошел все алгоритмы по пяти из восьми задач медицинской диагностики (Кононенко и др., 1998).
Другой пример - это сложная проблема в машиностроении, называемая проектированием сеток.
В одном исследовании, сложные алгоритмы индуктивной логики программирования достигли скромной точности классификации от 12 до 29% (Лаврачиц и Джероски, 1994; Помпе и Кононенко, 1997), а наивысшая точность Байесовского классификатора - 35%.
Байесовский классификатор стал для меня эталонным алгоритмом, который в любой медицинской области должен быть опробован перед любым другим усовершенствованным методом.
Аналогичный опыт имел и другой исследователь. Например, Spiegelhalter et al. (1993) в течение нескольких месяцев разрабатывали экспертную систему на основе байесовских сетей верований для диагностики сердечных заболеваний у новорожденных младенцев.
Окончательная классификационная точность системы составила 65,5%. Попробовав наивный байесовский классификатор, они получили 67,3%.
Теоретическая база для успешного применения байесовского классификатора (также известного как простой Байес) и его вариантов была разработана компанией Good (1950; 1964).
Эффективность такого подхода была продемонстрирована нами в медицинской диагностике и других областях применения (Кононенко и др., 1984; Честник и др., 1987). Но только в начале девяностых годов вопрос прозрачности (с точки зрения суммы информации, полученной в пользу или против данного решения) этого подхода был также рассмотрен и успешно проявлен в заявках на постановку медицинской диагностики (Кононенко, 1989; 1993).
Разработаны различные варианты и дополнения Байесовского классификатора
В 1990 г. Цестник разработал m-оценку вероятностей, которая значительно улучшила характеристики самых простых байесовских классификаторов в ряде медицинских проблем.
Кононенко (1991) разработал байесовский классификатор, выходящий за рамки " простоты" и обнаруживающий зависимости между атрибутами. Преимущество нечеткой дискретизации непрерывных признаков в байесовском классификаторе описано в (Кононенко, 1992)
Лэнгли (1993) разработал систему, которая использует байесовский классификатор в узлах дерева решений.
Паццани (1997) разработал другой метод явного поиска зависимостей между атрибутами в байесовском классификаторе. Прозрачность наивного байесовского классификатора может быть дополнительно улучшена с помощью соответствующей визуализации (Kohavi et al., 1997).