Найти тему
Игорь Белоус

РОБОТЫ: ОТ КОММЕРЧЕСКИХ БОТОВ К ЧИСТОМУ СОЗНАНИЮ

"Не верю в науку, не связанную с практикой, в образование, не связанное с практикой, в бизнес, не связанный с наукой и образованием"

Герман Оскарович Греф

Решил осмелиться начать свою заметку цитатой известной персоны. Как мне кажется, это как раз тот случай, когда глас Германа Оскаровича можно считать гласов божьим.

Но , от иронии и сарказма перейдём уже к теме...

Это заметку скорее всего стоит считать пробой пера в той области, которая меня долгое время притягивала.

Наше время характерно многими противоречивыми процессами. Роботы оскорбляют космонавтов, космонавты лезут в политику, политика превращается в цирк из роботов...

Но многие подмечают характерную тенденцию сразу в нескольких сферах человеческой деятельности — это синергетический подход к множеству проблем. С одной стороны это стало возможным благодаря развитию цифровых технологий. С другой стороны, человечество накопило громадную базу знаний, которая пока в достаточной степени открыта практически для каждого прямоходящего существа.

Я давно уже вышел на тему когнитивистики. Также я давно уже прочитал не только о создании универсального семантического языка, но и о реальном его применении в различных наукоёмких областях человеческой деятельности.

Сейчас очевидно, что человечеству потребовалось пройти значительный путь своей истории, прежде чем оно оказалось в состоянии хотя бы сформулировать те вопросы, которые рассматривает когнитивная наука. Но я уже полностью теперь уверен, что большинство этих вопросов поднималось уже очень давно, и вне рамок современной научной парадигмы. И это не просто некое общее абстрактное утверждение…

Я долгое время пытался подступиться к тем задачам, которые решает компьютерная лингвистика. Вышло это у меня не сразу. Оказалось, что как в алхимическом процессе, человек в области компьютерной лингвистики обязательно должен пройти ряд стадий посвящения. Нет, я понимаю, что мир вокруг давно уже структурирован фактором разделения труда… да только уже успел понять много нехорошего об этом разделении. Но это наверно уже совсем другая история...

Традиционная компьютерная лингвистика как правило выделяет три высших уровня восприятия текста: «семантика», «дискурс» и «прагматика». Не знаю, почему именно три, а не пять или двадцать. Наверно это снова тот самый случай, когда можно обосновать этот вариант градации «конструктивными соображениями». Что касается вот самого семантического уровня, то тут всё достаточно просто (на первый взгляд). Представьте, что перед вами уже находится оцифрованное предложение. Под оцифровкой в данном случае мы будет понимать: выявление начала и конца предложений, сопоставление всех слов в этих предложениях с данными словаря (или словарей!) а также проведение морфологического анализа предложения.

У вашего ручного компьютерного гомункула после такой оцифровки к этому предложению останутся некоторые вопросы, без которых ему точно никак нельзя будет добраться до смыслов. Ну во-первых,есть много слов, которые просто звучат и пишутся одинаково, но имеют вовсе не пересекающийся не в чем смысл. Это та проблема, которая частично пересекается с морфологическим анализом. Конечно, для человеческого восприятия это даже и проблемой не является…, но с роботами дела обстоят иначе. А дальше ещё интереснее. Часто случается, что выражения из слов могут нести смысл, если не прямо противоположный отдельно взятым («просуммированным») словам этого выражения, то по крайней мере гарантированно не читабельный, если набор этих слов анализировать механистично. И таких «идиом» может быть в тексте сколько угодно. Набор этих идиом конечно зависит от конкретного рассматриваемого языка.

Если семантика касается в первую очередь одного конкретного предложения, то говоря о «дискурсе», вы наконец выходим на уровень текста, как единого объекта. С одной стороны, между семантикой и дискурсом остаются пересекающиеся задачи. С другой стороны, дискурс решает главную для своего уроня задачу — отслеживания единого смыслового контекста, когда вещи, люди, действия, оценки — всё связывается наконец в единую смысловую структуру, в которой уже нет места недопониманиям на уровне слов и фраз.

Но контекст какого-то одного (или группы) текстов -это конечно замечательно. Но когда должна происходить магия применения смысла текста к некой внешней реальности смыслов? А это уже третий уровень: прагматика. Уровень прагматики занимается соединением нашего «субъективного» смыслового контекста c контекстами внешней реальности. Очевидно, что наш умный «субъект», анализирующий текст, для выхода на уровень прагматики должен сам иметь некое представление о внешнем мире, о пространстве смыслов внешнего мира… И именно на уровне прагматике становятся доступными такие категории, как «сарказм», «вежливость» и т.д….

Но это всё категории компьютерной лингвистики… Помните, как популярна тема расхождения духа и буквы закона? А теперь представьте, что подобная проблема (духа и буквы) встаёт даже не перед человеком, а перед роботом. Представили? Какой уровень оцифровки текста помог бы такому роботу справиться с задачей? А ещё представьте, что роботу предлагается извлечь прагматику из сказки или мифа. Что тогда? Безусловно, компьютерная лингвистика уже практически добралась и до этих уровней восприятия. Тем не менее, я хочу сделать некое неожиданное отступление. Что если мы воспользуемся более древними наработками человечества, чем компьютерная лингвистика, или даже сама лингвистика?

Бхартрихари — основоположник философии грамматики санскрита. Это уважаемый мыслитель создал «Вакьяпадию» - труд, который лёг в основу индийской грамматической традиции. Далее я бегло рассмотрю четыре вида речи, которые предложены в этом труде. Первая и наверно самая простая форма речи - «вайкхари». Это т. н. «грубая форма речи», обычный разговорный язык. В тантризме подчёркивается, что это именно проявленная обычная (звуковая) речь. Ну или то, что вам начитала по бумажке с сайта Алиса... И такая речь ассоциируется с психическом центром человека вишудха-чакрой. Как мы сейчас уже понимаем, такой уровень речи вполне себе доступен для примитивных сетевых ботов и бытовых роботов. Особенно, если не стараться задумываться , что там за кулисами...

Следующий уровень в этой градации: «мадхьяма». Вот тут уже становится интересно. Выражаясь рутинным алхимическим языком, именно этот уровень отвечает за меркурианскую составляющую (которой у бота может вовсе не быть!), т. е. за тут связь , которая образуется между предметом и словом в сознании субъекта. Именно на этом уровне происходит волшебный синтез внутренней и внешней реальности. Сам термин «мадхьяма» дословно означает «внутри» и «между». Т.е. это именно тот самый адаптер, рабочая лошадка , где понимание, общение и восприятие сходятся в одно. Где предмет, слово-предмет и само слово сходятся в сознании в единое целое.

И вайкхари, и мадхьяма тесно связаны с понятием СОЗНАНИЕ, бодрствования субъекта.

Следующий, более тонкий уровень речи - «пашьянти». Уровень пашьянти называют ещё «созерцающая речь». Считается что эта форма речи принадлежит к т. н. «частичному многообразию», т. к. Этот уровень находится с одной стороны за пределами органов чувств, но с другой стороны позволяет созерцать «всё объективное существование внутри себя».

Интересно что на этом уровне отсутствует какая-либо последовательность речи. Говорят, что уровень пашьянти больше похож не на саму мысль, а на промежуток между двумя мыслями. Т.е. этот уровень уже проблематично замерить через мозговые импульсы...

Даётся некий намёк также, что именно этот уровень уже прямо может быть связан с трансперсональным переживанием, когда субъект может схватить некое понимание о «единстве в многообразии». Не знаю. Как вы, а мне сразу показалось, что именно этот уровень достоин именоваться поэтическим… Ведь как раз ради тех самых «промежутков» между мыслями, ради плохо уловимых проблесков чего-то практически неизъяснимого как раз и творят настоящие поэты. Согласны?

И наконец, мы подошли к высшему виду речи… «Пара вач» («пара вак»). Далее просто «паравач». В каком-то смысле, это уже не совсем даже речь, точнее, совсем уже и не речь. В Интернете можно прочитать, что это «высший аспект речи» и «уровень чистого единства, в котором уже нет различий». Как я понял, на этом уровне уже становятся хорошо видны мировоззренческие различия очень близких по духу различных философских традиций. Но нам, простым смертным, наверно не грозит впасть в этих высокодуховные холивары… Хотя меня в последнее время подмывает составить наконец уже что-то вроде онтологической экспертной системы по терминологии кашмирского шиваизма... А сейчас, как мне кажется, нам просто достаточно уяснить, что «переживание субъекта» на этом уровне уже не зависит от «отношений с объектом». Но это вовсе не значит, что самого объекта (или объектов) может не быть. Это значит лишь то, что этот уровень не имеет жёсткой привязки в объекту… Иначе говоря, речь идёт о «высшей трансцендентной речи», которая является по сути «чистым осознанием истинного Я». На этом я позволю себе закончить заметку. Если под ней появятся комментарии или вопросы, то будет смысл продолжить тему.