Найти в Дзене

Машина Цетлина и ее предшественник «Кора-3» Бонгарда

Оглавление

Автор статьи - Шеля Айзекович Губерман.

простая блок-схема машины Цетлина
простая блок-схема машины Цетлина

Аннотация

В 2018 году была представлена новая обучающаяся машина — машина Цетлина. Она обладает рядом особенностей. Во-первых, задачи формулируются на языке пропозициональной логики. Во-вторых, операции выполняются в низкоразмерных подпространствах входного пространства. Машина Цетлина лишена значительного недостатка современных нейросетей: сложности в интерпретации решений и при этом демонстрирует высокие достижения. Цель данной работы — напомнить о том, что на заре истории искусственного интеллекта была разработана система распознавания основанная на пропозициональной логике, а также подчеркнуть ее огромный потенциал в имитации человеческого интеллекта.

Предисловие

Автор этой статьи считает необходимым поделиться о своей причастности к работам Цетлина. С 1963 по 1966 год я посещал семинар Михаила Цетлина, посвящённый коллективному поведению конечных автоматов, в Московском университете. После его трагической гибели в 1966 г И. М. Гельфанд, учитель и соавтор Цетлина, руководитель отдела в Институте Прикладной Математики им. Келдыша, пригласил меня занять его место в отделе.

Машина Цетлина и «Кора-3» Бонгарда

В 2018 году О. Гранмо представил машину Цетлина как новый и более эффективный чем нейронные сети инструмент для распознавания образов. «Глубинные нейронные сети часто требуют огромного объёма обучающих данных и значительных вычислительных ресурсов. При этом, немногие знают, что существует, возможно, более фундаментальный и универсальный механизм обучения, чем искусственный нейрон — это автомат Цетлина» [1, 9]. Ниже представлено краткое описание машины Цетлина.

1. На вход подаётся вектор булевых значений (литералов).
2. Признаки разделяющие классы (клаузулы), формируются в виде конъюнкций (соединение нескольких литералов с помощью логического «И» (AND). Выходные значения клаузул затем объединяются в правило классификации путем суммирование.
3. Информативные клаузулы находят с помощью контролируемого обучения.

Этот алгоритм совпадает с алгоритм распознавания образов Кора-3, разработанный Майклом Бонгардом в 1962 году и опубликованный в 1963 году [2]. Ниже представлено описание Кора-3.

1. Объекты распознавания делятся на два класса.

2. Объекты представлены в виде n-битных бинарных кодов.

3. Кора -3 находит отличительные признаки, характеризующие каждый из двух классов.

4. Каждый отличительный признак является конъюнкцией трех битов во входном бинарном коде.

5. Каждая конъюнкция трех битов имеет 8 возможных комбинаций 0 и 1: {0,0,0}, {0,0,1} … {1,1,1}.

6. В процессе обучения Кора -3 просматривает все возможные комбинации трех битов во всех входных кодах и подсчитывает в каком количестве объектов обучения первого (n1) и второго (n2) классов эта комбинация присутствует. Если n2 = 0 и n1 больше T, то эта комбинация является отличительным признаком для класса I, и наоборот — для отличительных признаков второго класса.

7. Принадлежность нового объекта к одному из двух классов определяется простым большинством отличительных признаков найденных в коде этого объекта..

Единственное значительное отличие между этими двумя алгоритмами заключается в том, что длина соединения в Кора -3 ограничена тремя битами. Однако на практике это не имеет большого значения: добавление каждого нового аргумента в конъюнкции существенно снижает количество объектов, в которых эта связка может быть обнаружена.

Кора -3 была первой программой распознавания образов, протестированной не на искусственных объектах (буквах), а на естественных — для различения геологических слоев, содержащих нефть, и слоев, содержащих воду. Это сделал Ш. Губерман с помощью программы М. Бонгарда Кора-3 [1, 3]. Первые результаты оказались многообещающими: количество ошибок по сравнению с профессионалами снизилось в три раза. Этот успех привлек значительное внимание в различных нефтедобывающих регионах СССР, и два года спустя, в 1965 году в Московском Нефтяном Институте им. Губкина состоялась первая в мире конференция по распознаванию образов (первая конфернция за пределами СССР состоялась в Вашингтоне в 1972ц году). Затем для решения этой же задачи тестировалась еще одна программа распознавания — метод опорных векторов (SVM).

Метод опорных векторов (SVM) показал уровень ошибок, сопоставимый с "Кора-3" Бонгарда. В результате сравнения было принято решение продолжить работу с "Кора-3" по следующим причинам. Было решено отказаться от алгоритмов, которые представляют решение в виде многомерного вектора (метод потенциалов и SVM), по двум причинам: 1) из-за невозможности объяснить логику решения профессионалам (геологам или врачам), 2) из-за трудностей в обеспечении программы дополнительными профессиональными знаниями. Ровно это было одним из очевидных преимуществ машины Цетлин над современными нейронными сетями, о котором говорилось в анонсе алгоритма [1]. Было решено продолжить работу с алгоритмом Бонгарда "Кора-3", который представляет решение в виде набора конъюнкций двух или трех входных параметров, которые можно назвать синдромами (это довольно популярное понятие в медицине).

В 1966 году была сделана еще одна попытка протестировать потенциал многомерного пространства в Институте прикладной математики имени М. В. Келдыша Российской академии наук в отделе возглавляемом выдающимся математиком Израилем Гельфандом. Идея нового распознавателя заключалась в использовании гиперплоскости во входном пространстве для разделения объектов двух классов, путем настройки положения гиперплоскости через минимизацию функции потерь (грубо говоря, с целью минимизации числа ошибок распознавания). В качестве инструмента для минимизации функции потерь был выбран метод градиентного спуска, улучшенный Гельфандом и Цетлином – метод оврагов для нахождения глобального минимума сложной функции [Гельфанд 1961]. Разработанный распознаватель имел те же ключевые компоненты, что и будущие нейронные сети: многомерное пространство, поиск глобального минимума методом градиентного спуска и функция потерь.

Задача оставалась прежней - различение слоев с нефтью и с водой. Уровень распознавания был таким же, как достигли другие программы распознавания. Но во время экспериментов было замечено странное явление: оказалось, что имея 50 объектов в 11-мерном пространстве, можно отделить каждый объект от остальных. Это противоречило нашему геометрическому здравому смыслу: считалось, что каждый класс занимает во входном пространстве компактную область (кластер), и большинство объектов не могут быть отделены от остальных объектов, принадлежащих к тому же классу, с помощью гиперплоскости. Понятие компактности (термин примененный Браверманом) воплощает в себе смысл обобщения. Это означает, что потеря компактности приводит к потере обобщения. После этого было решено окончательно отказаться от использования супер-многомерного пространства и градиентного спуска и остаться с 3-мерными подпространствами "Кора-3" Бонгарда, сосредоточившись на описании объектов распознавания.

Кора-3 и основанные на ней технологии применения имеют долгую и успешную историю применения и отличные достижения, и они до сих пор используются [4, 10].

Медицина

В 1968 году профессор Э. Кандел (один из пионеров стереотаксической хирургии мозга) обратился за помощью к Гельфанду. Проблема заключалась в следующем: существовало два метода лечения пациентов с геморрагическим инсультом: пассивный (медикаментозный) и активный (хирургический). Мировая статистика, касающаяся преимущества одного из них, была противоречивой. Может ли математика прояснить эту проблему?

После обсуждения ответ Канделю был следующим: задачу нужно изменить: вместо того чтобы решать, какой метод лечения лучше в общем, давайте найдем, какой из них лучше для конкретного пациента. Такой подход является воплощением древнейшей идеи медицины — лечить пациента, а не болезнь. Это требует создания двух программ: одна ответит на вопрос «Останется ли пациент жив после медикаментозного лечения?», а вторая — «Останется ли пациент жив после операции?»

Для реализации проекта потребовалось четыре группы пациентов для обучения и тестирования: 1) пациенты, которые выжили после медикаментозного лечения, 2) пациенты, которые умерли после медикаментозного лечения, 3) пациенты, которые выжили после операции, 4) пациенты, которые умерли после операции. Каждый пациент описывался набором из 22 параметров, отражающих анамнез и текущее состояние пациента в первые 6 часов после поступления. Количество прооперированных пациентов было ограничено — всего 120 для двух групп обучения.

После обучения результаты тестирования на ретроспективных данных показали многообещающие результаты: прогноз исхода консервативного лечения оказался правильным в 95% случаев, а прогноз исхода операции — в 90% случаев. Затем была начата предварительная клиническая проверка. Для каждого пациента, проходившего лечение, выдавался и прогноз, но он становился доступен медицинскому персоналу, участвующему в лечении лишь после того, как пациент покидал больницу. Этот этап продолжался два года. Результаты — 91% правильных предсказаний. Наконец, наступила полная клиническая реализация: для каждого пациента, поступающего в больницу и диагностированного с геморрагическим инсультом, в течение первых 6 часов данные, необходимые для анализа, отправлялись в Институт прикладной математики, и два прогноза немедленно возвращались в больницу и предоставлялись дежурному хирургу, принимающему решение. Вот результаты после четырех лет работы [5, 6].

В 16 случаях компьютер выдал настоятельную рекомендацию оперировать. 11 из них были прооперированы, и все 11 выжили. Остальные 5 пациентов не были прооперированы (по разным причинам), и все 5 умерли в соответствии с прогнозом компьютера. Для 5 пациентов была настоятельно рекомендована медикаментозная терапия. 3 из них получили медикаментозное лечение и выжили. 2 пациента перенесли операцию и умерли. Таким образом, настоятельные рекомендации компьютера по выбору метода лечения оказались правильными в 100% случаев. Во всех случаях с альтернативным прогнозом, когда действия хирургов противоречили рекомендациям компьютера, пациенты умирали.

Будет ли сегодня программное обеспечение, которое делало такие предсказания, квалифицировано как интеллектуальное? Несомненно. Сравнимы ли эти результаты с результатами современного искусственного интеллекта? Нет. Вот лучшее достижение в предсказании исхода инсультов мозга. У 204 пациентов сочетание нейронных сетей (сверточная нейронная сеть и полносвязная нейронная сеть с двумя скрытыми слоями) обучались на клинических данных для прогноза улучшения через 90 дней. В сумме они обеспечили точность 71% (по улучшению) и 74% (по хорошему клиническому исходу). Для сравнения, 3 стандартныхклинических прогностических показателя достигли максимальной точности 65% и 68% соответственно [11].

Сейсмология

В 1966 году профессор Кейлис-Борок (в то время Президент Международного геофизического союза) обратился к Гельфанду за помощью в решении сейсмологической задачи оценки сейсмической опасности различных территорий в Центральной Азии. Новизной был метод деления данной территории – морфоструктурное районирование, отражающее блочную структуру земной коры. Блоки разделены разломами, а пересечения разломов образуют дизъюнктивные узлы. Было обнаружено, что подавляющее большинство сильных землетрясений происходило именно в этих узлах, но не во всех. Новой целью для распознавания образов стало разделение всех дизъюнктивных узлов на два класса: опасные (D-узлы) и неопасные (N-узлы). В опасных узлах могут происходить землетрясения с магнитудой M > M0, а в N-узлах – не могут. Таким образом, описание проблемы кардинально изменилось.

Программа Кора-3 использовалась для выявления узлов, где могут происходить сильные землетрясения в различных регионах мира. Вот результаты тестирования в Калифорнии 40 лет спустя: в это время в Калифорнии произошло 19 землетрясений с магнитудой M > 6.0. Семнадцать из них произошли в районах, предсказанных как опасные. Эпицентры 12 из них расположены в зонах, где ранее уже были сильные землетрясения, так что это предсказание было тривиальным, но 5 землетрясений произошло в местах, где сильные землетрясения ранее не наблюдались.

Прогноз для Анатолии и Восточных Балкан был опубликован в 1973 году [12]. В этом районе после 1974 г. произошло 36 землетрясений с М ≥ 6.5, причем эпицентры 32 из них располагались в местах, предсказанных как сейсмоопасные в 1974 г. С помощью программы Кора-3.

Нефтеразведка

В настоящее время поиск нефти и газа ограничивается нахождением подземных пористых геологических структур, которые могут содержать жидкость. Чтобы выяснить, содержит ли данная структура нефть/газ или воду, необходимо пробурить скважину, несмотря на многолетние усилия решить эту задачу с помощью геофизики и геохимии. Причина неудачи заключается в том, что основана она была на неверной концепции —теории биогенного происхождения нефти и газа. Профессор Ю. Пиковский, выступая сторонником теории абиогенного происхождения нефти и газа, предложил искать «трубопроводы», которые доставляют нефть и газ из мантии. Он предположил, что пересечения геологических разломов (узлы) могут выполнять роль таких трубопроводов. Когда эта гипотеза была проверена, оказалось, что она верна, но не наоборот: не каждый узел содержит гигантское нефтяное месторождение. Задача разделения узлов на «нефтеносные» и «пустые» была решена с помощью программы распознавания образов Kora-3 для нескольких регионов мира: Анд Южной Америки, Калифорнии, Западной Сибири, Северного моря и некоторых других. Вот один пример: прогностическая карта нефтяных и газовых месторождений в Андах Южной Америки была опубликована в 1986 году. Все гигантские нефтяные и газовые месторождения, открытые в этом регионе после 1984 года, расположены в предсказанных местах [7].

Заключение

Представленные выше результаты свидетельствуют о том, что машина Цетлина является правильным шагом на пути улучшения интеллектуальных способностей обучающей машины. Но ээого недостаточно, поскольку общее убеждение в том, что математика и компьютеризация являются основными путями прогресса для "описательных" наук (таких как геология, медицина, психология и др.), является неверным. Их незаменимая роль в системе наук заключается в разработке адекватного языка для описания изучаемых явлений. Математика не может помочь специалистам в этой трудной работе, но математики могут помочь, привнося дисциплину математики в интеллектуальные усилия профессионалов. 60 лет опыта в разработке приложений КОРА-3 подтверждают эффективность таких попыток.

Стоит отметить, что описание машины Цетлина занимает пять страниц сложной математики, в то время как описание КОРА-3 - всего полстраницы. Возможно, причина в том, что одним из авторов упомянутых выше проектов был И. Гефанд - один из величайших математиков XX века.

Это также указывает на то, что, возможно, настало время изменить цель с "создания системы, котораяравна или превосходит человеческий интеллект" на "создание системы {человеческий интеллект + компьютер}, которая сможет решать проблемы, которые до сих пор не удавалось решить людям.

Библиография

1. Гранмо О. и др. (2021) Использование машины Цетлина для обучения правилам, понятных человеку, для высокоточной категоризации текстов с медицинскими приложениями.

https://arxiv.org/abs/1809.04547

2. Бонгард М. и др. (1963) Решение геологических задач с использованием программ распознавания. Советская геология, № 6, Москва. (На русском).

3. Интерпретация комплекса геологических и геофизических данных на компьютерах. (1966) Под ред. Ш. Губермана. Москва, Издательство "Недра".

4. Горшков А. и др. Результаты предсказания самых сильных землетрясений 6 февраля 2023 года на юге Турции. Изв. РАН, Физика твердой Земли60, 339–345 (2024) https://doi.org/10.1134/S1069351324700423.

5. Гельфанд и др. Компьютерное изучение прогноза церебрального кровоизлияния для выбора оптимального лечения. Неврохирургия, Эдинбург, 1974.

6. Гельфанд и др. Прогноз церебрального кровоизлияния для выбора оптимального лечения с использованием компьютеров. Проблемы неврохирургии, 1976, № 3.

7. Губерман Ш. и Пиковский Ю. (2019). Полевое испытание подтверждает прогноз расположения гигантских нефтегазовых месторождений в Андах Южной Америки, сделанный в 1986 году. Журнал исследований и технологий добычи нефти. 9 (2):

8. Чеботарева Н. (1984). Хирургическое лечение внутримозговых кровоизлияний при артериальной гипертензии. Издательство "Медицина", Москва.

9. Гельфанд И.М., Цетлин М.Л. (1961) Нелокальный принцип поиска в задачах автоматической оптимизации. Доклады АН СССР Академии Наук.. Т. 137. № 2. (На русском).

10. Lanine G. and Vennet R. Failure prediction in the Russian bank sector with logit and trait recognition models Ghent University, Belgium August 2005

11. Mouridsen K. et al , Artificial Intelligence Applications in Stroke. Stroke, 2020, July.

12. Ruiz-Shulcloper J., de la Vega Doria. L. Fuzzy KORA-Ω algorithm. Proceedings of the Sixth European Congress on Intelligent Techniques and Soft Computing, EUFIT’98, pp.1190-1194, Aachen, Germany (1998).

13. Гельфанд И.М., Губерман Ш.А., Жидков М.П., Калецкая М.С., Кейлис-Борок В.И., и Рансман Е.Я. (1973) Опыт переноса критериев высокой сейсмичности из Центральной Азии в Анатолию и смежные районы. Докл. Акад. Наук СССР, , т. 210, № 2, стр. 327–330.

Наука
7 млн интересуются