Найти тему
Планетные истории

Байесовский классификатор. Искусственный интелект.

Введение

В статье представлен обзор развития интеллектуального анализа данных в медицине с точки зрения машинного обучения: исторический взгляд, современный взгляд и взгляд на некоторые будущие тенденции в этой области прикладного искусственного интеллекта.

В статье не ставится задача дать исчерпывающий обзор, а скорее описаны некоторые под темы и направления, которые, с моей личной точки зрения, важны для применения машинного обучения в медицинской диагностике.

В историческом обзоре я подчеркиваю наивность Байесовского классификатора. Я представляю сравнение некоторых современных систем, представителей каждой отрасли машинного обучения, при применении к нескольким медицинским диагностическим задачам.

Будущие тенденции иллюстрируются двумя тематическими исследованиями.

В первом описывается недавно разработанный метод работы с надежностью решений классификаторов, который представляется перспективным для интеллектуального анализа данных в медицине.

Другая характеризует подход к использованию машинного обучения с целью проверки некоторых необъяснимых явлений из комплементарной медицины, который (пока) не одобрен православным медицинским сообществом, но может в будущем сыграть важную роль в общей медицинской диагностике и лечении.

Искусственный интеллект

Искусственный интеллект является частью компьютерной науки, которая стремится сделать компьютеры более интеллектуальными. Одним из основных требований к любому разумному поведению является обучение.

https://www.pinterest.ru/pin/340162578097344251/
https://www.pinterest.ru/pin/340162578097344251/

Сегодня большинство исследователей сходятся во мнении, что без знаний не бывает интеллекта. Поэтому машинное обучение (Shavlik and Dietterich, 1990; Michie et al., 1994; Mitchell, 1997; Michalski et al., 1998) является одной из основных отраслей искусственного интеллекта и одной из наиболее быстро развивающихся областей исследований ИИ.

Алгоритмы машинного обучения изначально разрабатывались и использовались для анализа наборов медицинских данных.

Сегодня машинное обучение предоставляет несколько незаменимых инструментов для интеллектуального анализа данных. Особенно в последние несколько лет цифровая революция обеспечила относительно недорогие и доступные средства для сбора и хранения данных.

Современные больницы хорошо оснащены средствами мониторинга и другими средствами сбора данных, а данные собираются и передаются в крупные информационные системы.

Технология машинного обучения в настоящее время хорошо подходит для анализа медицинских данных, в частности, проводится большая работа по постановке медицинской диагностики небольших специализированных диагностических задач.

В специализированных больницах или их отделениях данные о правильном диагнозе часто можно получить в виде медицинской карты. Все, что нужно сделать, это ввести в компьютерную программу карты пациентов с известным правильным диагнозом, чтобы запустить алгоритм обучения. Это, конечно, чрезмерное упрощение, но в принципе, медицинские диагностические знания могут быть автоматически получены из описания случаев, разрешенных в прошлом.

Полученные классификаторы могут затем использоваться либо для оказания помощи врачу при диагностике новых пациентов с целью повышения скорости, точности или надежности диагностики, либо для обучения студентов или врачей-неспециалистов диагностировать пациентов по специальным диагностическим проблемам.

Исторический обзор

Как только электронные компьютеры начали использоваться в пятидесятые и шестидесятые годы, были разработаны алгоритмы, позволяющие моделировать и анализировать большие массивы данных.

С самого начала возникли три основных направления машинного обучения. Классическая работа в символическом обучении описана Хантом и др. (1966), в статистических методах Нильссоном (1965) и в нейронных сетях Розенблатом (1962).

На протяжении многих лет все три ветви разрабатывали передовые методы (Michie et al., 1994): статистические методы или методы распознавания образов, такие как k-близкие соседи, дискриминантный анализ и Байесовские классификаторы, индуктивное обучение символическим правилам, таким как нисходящий ввод дерева решений, правила принятия решений и введение логических программ и искусственные нейронные сети, такие как многослойная передняя нейронная сеть с поддержкой распространения знаний, H. Коопередача и самоорганизация сети с поддержкой развития памяти.

Насыщенный байесовский классификатор

Я ограничиваюсь историческим обзором статистических методов простым классификатором Байесейна. С самого начала меня это очень заинтересовало. Алгоритм чрезвычайно прост, но очень мощный, и позже я обнаружил, что он может дать и исчерпывающие объяснения, что было подтверждено в ходе долгих обсуждений с врачами.

Меня поразила его эффективность и способность превосходить самые передовые и сложные алгоритмы при решении многих медицинских и других диагностических задач.

Например, по сравнению с шестью алгоритмами, байесовский классификатор превзошел все алгоритмы по пяти из восьми задач медицинской диагностики (Кононенко и др., 1998).

Другой пример - это сложная проблема в машиностроении, называемая проектированием сеток.

В одном исследовании, сложные алгоритмы индуктивной логики программирования достигли скромной точности классификации от 12 до 29% (Лаврачиц и Джероски, 1994; Помпе и Кононенко, 1997), а наивысшая точность Байесовского классификатора - 35%.

Байесовский классификатор стал для меня эталонным алгоритмом, который в любой медицинской области должен быть опробован перед любым другим усовершенствованным методом.

Аналогичный опыт имел и другой исследователь. Например, Spiegelhalter et al. (1993) в течение нескольких месяцев разрабатывали экспертную систему на основе байесовских сетей верований для диагностики сердечных заболеваний у новорожденных младенцев.

Окончательная классификационная точность системы составила 65,5%. Попробовав наивный байесовский классификатор, они получили 67,3%.

Теоретическая база для успешного применения байесовского классификатора (также известного как простой Байес) и его вариантов была разработана компанией Good (1950; 1964).

Эффективность такого подхода была продемонстрирована нами в медицинской диагностике и других областях применения (Кононенко и др., 1984; Честник и др., 1987). Но только в начале девяностых годов вопрос прозрачности (с точки зрения суммы информации, полученной в пользу или против данного решения) этого подхода был также рассмотрен и успешно проявлен в заявках на постановку медицинской диагностики (Кононенко, 1989; 1993).

Разработаны различные варианты и дополнения Байесовского классификатора

В 1990 г. Цестник разработал m-оценку вероятностей, которая значительно улучшила характеристики самых простых байесовских классификаторов в ряде медицинских проблем.

Кононенко (1991) разработал байесовский классификатор, выходящий за рамки " простоты" и обнаруживающий зависимости между атрибутами. Преимущество нечеткой дискретизации непрерывных признаков в байесовском классификаторе описано в (Кононенко, 1992)

Лэнгли (1993) разработал систему, которая использует байесовский классификатор в узлах дерева решений.

Паццани (1997) разработал другой метод явного поиска зависимостей между атрибутами в байесовском классификаторе. Прозрачность наивного байесовского классификатора может быть дополнительно улучшена с помощью соответствующей визуализации (Kohavi et al., 1997).