Найти тему
Душкин объяснит

Гибридная парадигма

Давайте продолжим погружаться в основы Искусственного Интеллекта. Мы уже внимательно изучили две парадигмы Искусственного Интеллекта — нисходящую и восходящую, а также поняли суть нескольких подходов к построению искусственных интеллектуальных систем. Сегодня я хотел бы более детально дать вам понимание гибридной парадигмы. Так что будьте внимательны и вперёд.

Итак, мы уже разобрались, что философия сознания, начавшаяся развиваться вместе с более «взрослым» пониманием задач и проблем Искусственного Интеллекта, выделяет две парадигмы построения интеллектуальных систем и искусственных разумных существ: нисходящую и восходящую.

Нисходящая парадигма объединяет такие технологии, как экспертные системы, универсальные машины вывода, базы знаний. Самым выдающимся и далеко продвинувшимся направлением в рамках этого подхода является направление символьных вычислений, которое основано на логике манипулирования символами.

Восходящая парадигма объединяет такие технологии, как искусственные нейронные сети, эволюционные и молекулярные вычисления.

Восходящая парадигма моделирует биологические основы разума человека, в то время как нисходящая имитирует высокоуровневые психологические процессы: мышление, рассуждение, речь, эмоции, творчество.

Однако обе парадигмы имеют как достоинства, так и свои недостатки. В частности, нейронные сети и все смежные технологии обладают очень существенными ограничениями, среди которых можно отметить следующие.

Во-первых, мы до сих пор не обладаем полным пониманием того, как обучается нейронная сеть. Математический аппарат, конечно, имеется, однако при переходе в практическое русло вычислительная сложность интерпретации того, как и, главное, почему нейросеть настроила свои весовые коэффициенты так, а не иначе, нелинейно возрастает до космических величин. И в итоге получается чёрный ящик в качестве модели чёрного ящика. Это совсем не то, что нужно.

Впрочем, постепенно для интерпретации разрабатываются методы. Например, для свёрточных нейросетей можно визуализировать весовые коэффициенты для свёрточных слоёв, и это показывает, на какие элементы изображения откликается тот или иной нейрон внутри сети. Но это всё равно не отвечает на вопрос о том, почему именно так настроились коэффициенты, и не объясняет принятых нейросетью решений.

Во-вторых, часто в нейронную сеть для обучения попадают некорректные данные, которые выглядят как валидные. Например, для медицинской проблемной области часто случается так, что диагнозы ставятся неверно, лекарственные средства назначаются неадекватно, а потому нет никакой гарантии того, что при обучении нейросети ей не «скармливаются» такие некорректные данные. Кто даст гарантию того, что обученная на некорректных данных нейросеть даст правильное заключение? А инструмента интерпретации того, как она обучилась, нет.

В-третьих, распознающие нейронные сети подвержены так называемой атаке «враждебных изображений», которые построены специально таким образом, чтобы сбить нейросеть с толку. Например, если нейросеть научилась распознавать стиральные машины, то ей можно дать изображение, которое она распознает как «сейф» или «музыкальная колонка». Это похоже на оптические иллюзии у людей. Впрочем, естественные нейронные сети тоже подвержены этому, просто в меньшем масштабе.

В-четвёртых, в процессе развития человеческих знаний всегда появляется новая информация, которая часто не дополняет, а заменяет старую. Человек-эксперт постоянно актуализирует свои знания, занимаясь самообразованием и повышением квалификации. Как поступать с нейросетью? Ведь невозможно проинтерпретировать то, как она обучилась, а потому нет никакого способа точечно заменить устаревшую информацию. Сеть приходится обучать заново.

Люди постоянно актуализируют свои знания, занимаясь самообразованием и повышением квалификации
Люди постоянно актуализируют свои знания, занимаясь самообразованием и повышением квалификации

В-пятых, естественные нейронные сети фундаментально отличаются от искусственных — сегодня ещё не разработано окончательной рабочей модели того, как обучается человек. С учётом непрекращающегося нейрогенеза в отдельных областях головного мозга есть понимание, что в нейросетях в голове человека могут появляться не только новые отдельные нейроны, но и даже целые слои. Впрочем, и нейроны, и слои также могут исключаться из процесса вычислений. И если появление и исключение синаптических контактов можно эмулировать весовыми коэффициентами в искусственных нейронных сетях, то про искусственные модели с появлением новых слоёв пока не слышно.

В-шестых, центральная нервная система человека представляет собой не обычную многослойную нейросеть, а десятки отдельных сетей, связанных друг с другом. Иногда связанных совсем нелинейным образом — с кучей реципрокных и обратных связей, которые могут выходить и входить в промежуточные слои любой сети. Сигнал от сенсора до исполнительного устройства в человеке может пройти через десяток коммутирующих ядер, запустить параллельные процессы и в итоге так и не дойти до сознания, оставшись в подсознательной области.

Структура нервной системы очень сложна
Структура нервной системы очень сложна

Наконец, в-седьмых, что касается коры головного мозга, где, как предполагается, и скрывается тайна сознания, то обработка информации в нейросети может завершиться в любом из шести слоёв коры, но только если сигнал дойдёт до пятого или шестого слоя, он будет доступен для осознания при помощи символьной логики. Вся подсознательная деятельность готовит базу для принятия решения на основе механизма манипулирования символами. Именно этот аспект надо рассмотреть более подробно.

Обработка информации в неокортексе может завершиться на любом из шести слоёв
Обработка информации в неокортексе может завершиться на любом из шести слоёв

Вся накопленная человечеством информация представлена в символьном виде. И именно синтаксическая манипуляция символами позволяет делать какие-либо умозаключения. Это совершенно иной подход, фундаментально отличающийся от нейросетей, какими бы глубинными они ни были. Вполне вероятно, что где-то там в очень глубокой нейросети может зародиться логика манипулирования символами, но пока это неизвестно в силу уже неоднократно упомянутого отсутствия формализма интерпретации работы нейросетей. А с другой стороны математика предоставляет достаточное число формализмов и инструментов для логической обработки символов.

И тут хотелось бы отметить, что рождение настоящего Искусственного Интеллекта, скорее всего, произойдёт где-то на стыке двух парадигм, то есть при использовании гибридной парадигмы. Вряд ли в ближайшее время удастся реализовать кремниевый аналог человеческой нервной системы, поскольку её сложность невообразима. Скорее всего, проще вырастить биологическую нейросеть такого объёма, чем найти вычислительные мощности для её симуляции.

Однако нейросетевой подход даст базовые инструменты для первичной обработки и коммутации информации, поступаемой с разнообразных сенсоров на вход системе управления и принятия решений в составе Искусственного Интеллекта. А в ней уже будет использоваться символьный подход, реализованный в виде универсальной машины вывода. И такая конвергенция двух технологий, в конце концов, позволит реализовать давнюю мечту человека — рождение искусственного разума.

Гибридная искусственная интеллектуальная система представляет собой ни что иное, как универсальную кибернетическую машину, которая имеет три основных элемента: аффекторы, подсистему управления и эффекторы. При помощи аффекторов она воспринимает сигналы окружающей среды, которые обрабатываются в подсистеме управления, сигналы из которой далее поступают в эффекторы, которые на окружающую среду воздействуют. Это общая схема любого автономного агента, поэтому гибридная искусственная интеллектуальная система одновременно является и интеллектуальным агентом, реализуя уже агентный подход.

-5

Гибридная интеллектуальная система отличается тем, что её аффекторы и эффекторы связаны с подсистемой управления и принятия решений через нейронные сети. Тем самым реализуется восходящая парадигма.

Аффекторная нейронная сеть принимает очищенные сенсорами сигналы внешней среды и преобразует их в символы, которые подаются на вход универсальной машине вывода. Последняя осуществляет вывод на основе символьных знаний из своей базы знаний и выводит результат, который тоже представляется в виде символов. Тем самым реализуется нисходящая парадигма.

Символьный результат подаётся на вход моторной нейронной сети, которая преобразует высокоуровневые символы в конкретные сигналы управления исполнительными устройствами.

Кроме всего прочего внутри гибридной интеллектуальной системы должны быть реализованы контрольные связи от всех её элементов к сенсорам. Тем самым реализуются адаптационные механизмы, основанные на гомеостазе внутреннего состояния системы.

Сенсоры фиксируют изменение внутреннего состояния каждой подсистемы, их элементов и комплексов, а в случае выхода контролируемых значений за пределы установленных гомеостатических интервалов подсистемой управления принимается решение, целью которого будет возврат изменённых показателей в установочный интервал.

-6

Именно система с такой архитектурой при переходе через определённый порог сложности может считаться разумной. При этом разумность в этом смысле определяется как адекватное реагирование не только на стимулы внешней среды, но и на внутренние состояния, что также включает в себя постоянный мониторинг состояния собственной подсистемы управления, что называется «саморефлексией», которая и приводит к осознанию.

Мы устроены именно так
Мы устроены именно так

Давайте рассмотрим пример. Самым тривиальным примером гибридной интеллектуальной системы является человек. На определённом уровне абстракции человек как система выглядит именно так. Роль сенсоров выполняют не только все те общеизвестные рецепторные системы, как зрение, слух, вкус, обоняние, осязание и равновесие, но различного рода ноцицепторы, терморецепторы, проприорецепторы и хеморецепторы. Именно последние из перечисленных осуществляют мониторинг гомеостаза внутренних параметров организма, начиная от кислотности крови до наличия и концентрации в физиологических жидкостях организма определённых веществ.

Каждый тип рецепторов непрерывно воспринимает сигналы из внешней по отношению к нему среды, при этом сразу же осуществляется первичная фильтрация входных значений по полосе принимаемого диапазона. Например, фоторецепторы на сетчатке глаза воспринимают фотоны только определённых длин волн.

Далее отфильтрованные сигналы «оцифровываются» и передаются в первичные сенсорные нейронные сети, где осуществляется перекоммутация и задействование следующих областей нервной системы. Сигнал идёт во всевозможные центры принятия решений, и часто он даже не доходит до коры головного мозга, поглощаясь в подсознательны областях (но там также накапливается информация, которая в какой-то момент может стать основой и источником интуитивного инсайта).

Если же сигнал доходит до коры, то там он начинает активно преобразовываться и задействовать множество ассоциативных связей, возбуждая побочные цепи. В итоге до верхних слоёв неокортекса, где, как предполагается, и находится сознание, доходит символьная информация.

Например, если последовательность множества сигналов, падающих на сетчатку глаза, формирует на ней изображение движущейся рыжей кошки, то на верхних слоях неокортекса активированы те нейрональные колонки, которые отвечают за такие символы, как «кошка», «млекопитающее», «рыжее животное» и множество других.

Кошка, млекопитающее, рыжее животное, тысячи других ассоциаций
Кошка, млекопитающее, рыжее животное, тысячи других ассоциаций

Путём логических умозаключений (на самом деле, последовательного возбуждения каскадов нейронов на верхних слоях коры) формируется ответная реакция. Она также кодируется в виде символов.

Например, человек, видящий кошку, может выбрать из всего множества ассоциаций одно слово «кошка», сосредоточившись на нём и подав сигнал нижележащим подсистемам активировать поведенческую реакцию типа «воскликнуть наименование объекта».

Моторная нейронная сеть воспринимает этот символьный сигнал и начинает распространять его всё ниже и ниже. На самом нижнем уровне символ «кошка» преобразуется в динамическую последовательность сокращений мышц в разных отделах тела, чья совместная деятельность заключается в таком синхронизированном выполнении ряда элементарных сокращений, которые приведут к возникновению исходящего из лёгких потока воздуха с одновременным формированием в голосовых связках, нёбе, языке и зубах быстрого комплекса сжатий и растяжений, которые приводят к возникновению вибраций определённой амплитуды и частоты. Которые, в свою очередь, воспринимаются окружающими людьми и самим человеком, который произнёс слово, как слово «кошка».

Сам человек воспринимает ушами сказанное самим собой слово, которой через такой же каскад реакций и перекоммутаций нейронных сигналов доходит то контролирующего элемента неокортекса, который сравнивает заказанное и исполненное слово — они должны совпасть. Эта петля обратной связи контроля поведения широко используется в большинстве поведенческих актов человека. Всё это происходит практически мгновенно и без задействования сознания и внимания. Тем не менее, сознание основано именно на этом механизме.

Комплекс воздействий на голосовой аппарат при волевом речевом акте
Комплекс воздействий на голосовой аппарат при волевом речевом акте

Вот на этой животрепещущей ноте я спешу закончить эту учебную заметку. Как вы понимаете, специалист по Искусственному Интеллекту сегодня должен обладать обширным комплексом знаний, и этим занятием я также хотел побудить в вас тягу к изучению различных направлений науки и технологии. Ведь Искусственный Интеллект — это не только программирование нейронных сетей, это междисциплинарный подход, требующий знаний в большом количестве отраслей знаний.