249 подписчиков

О том, как Искусственный Интеллект голосовых помощников понимает смысл текста или речи. Часть 2.

9 минут

10 прочтений

17 июня 2021

Итак, в прошлый раз я вам рассказывал про структуру понятийной базы гуманитария и ее особенности. А сейчас я расскажу про другую структуру, которую имеют люди с так называемым математическим складом ума. Развитие той или иной структуры, так сказать зерно или алгоритмическое ядро, которое определяет тип пониятийного классификатора, закладывается генетически.

Т.е. нельзя направить развитие ребенка по первому или второму типу, это генетический код. Поятийная база и ее развитие обеспечивает программа и сменить ее нельзя. Попытка насилия над ребенком, тренировка его мозга чисто математическими задачами, не приведет к смене типа классификатора, в итоге развитие будет сильно тормозиться, мозгу придется использовать текущий древовидный классификатор понятий для несвойственных ему видов мыслительных процессов.

Конечно, он постарается оптимизировать эти алгоритмы под свои, что несколько увеличит производительность, детский мозг очень гибок, но все равно, в сравнении с ребенком, имеющим врожденный классификатор математического типа, он будет сильно отставать от него в развитии.

Если же математикой усиленно тренировать человека взрослого, особенно с сильно развитой древовидной структурой гуманитарного типа, это неизбежно приведет к появлению ЕЩЕ одного классификатора, а не оптимизации уже имеющегося под математические задачи.

А появление еще одного классификатора понятийной базы влечет за собой появление второго Я, т.е. еще одной личности, а проще говоря вы можете таким образом инициировать раздвоение личности-шизофрению. То же самое получится, если во взрослом возрасте математика заставлять решать много гуманитарных задач для которых их мозг не приспособлен.

Например заставлять решать нетривиальные логические задачи, парадоксы, думать над философскими вопросами, изучать психологию, разрабатывать сложные механические конструкции типа АКПП, и вообще тренировать пространственное воображение и связи любого рода объектов взаимодействия в них во времени.

Т.е. заставлять решать задачи, в которых впринципе не применяются числа и символы, а используются лишь прямые логические причинно следственные связи между объектами с множественными переменными свойствами. Вот этот тип задач совершенно не подходит людям с математическим складом ума, от слова СОВСЕМ, и это является следствием их структуры понятийного классификатора.

Есть масса фильмов, где очень способные математики страдали шизофренией, которая развилась у них во время решения сложных задач, потребовавших в какое то время гуманитарных алгоритмов мышления и способов оптимизации этого мышления. Посмотрите кто не смотрел фильм «Игры разума».

Отец основатель классической теории множеств Георг Кантор, также столкнулся с нерешаемой математическим способом задачей о возможности существования множества всех множеств, подвела неполнота матаппарата, догмы и стереотипы.

Т.е. математическая логика для решения задачи не подходила точно также, как она не подходит и сегодня для доказательства аксилмы N^0=1 , нужно было пользоваться формальной Аристотелевской логикой, предикатной, которая обладает полнотой и которая вызывает у математиков большие трудности в использовании...в ней нет цифр и символов, а еще в этой логике есть время. В математической логике нет времени и потому нет причины и следствия.

Они заменены на посылку и вывод, а при необходимости их можно даже менять местами, что в Аристотелевской логике равносильно запуску времени в обратную сторону. Кроме того, в математической логике отсутствует закон логики достаточного основания. Т.е. вычеркнут целый закон логики…СОВСЕМ. В общем, не удивительно, что матаппарат оказался недостаточным, чтобы Кантор смог решить проблему множества множеств.

Кантору потребовались особенности мышления гуманитариев и он стал усиленно их развивать думая о своем парадоксе, и в итоге 28 последних своих лет жизни Кантор провел в сумасшедшем доме с тяжелой формой шизофрении, превратившей гениального математика в полного неадеквата. Т.е. можно сказать, что парадокс теории множеств его съел в прямом смысле слова.

Меж тем, никакого парадокса там естественно не оказалось, множество всех множеств было успешно найдено, парадокс Рассела разрешен, а саму теорию множеств Кантора назвали впоследствии наивной. Это ее официальное современное название кстати, вместе с прилагательным «наивная».

Но оставим беднягу Кантора в покое и вернемся к математическому классификатору понятийной базы, что это такое и как он устроен?

Правильное название этой структуры ГРАФ и страждущие могут самостоятельно поковырять теорию Графов. Так вот именно он лежит в основе конструкции понятийной базы этого типа. Лучше всего показать, что это такое, на семантическом графе в системе координат которого зашифрована вся языковая конструкция людей с математическим складом ума, а заодно эта структура продублирована во всех поисковых системах т.е. Яндекс, Гугл, Бинг и пр. Байду.

Именно на этой структуре работают автоматические переводчики с языка на язык и всякие Алисы, Сири и пр. интеллектуальные голосовые помощники. Так что можно сказать, что все они математики по рождению и гуманитариями никогда не станут. Семантический граф-основа ранжирования сайтов по смыслу содержащегося в них текстов. Это базис, каркас, на котором держится весь смысловой поиск в интернете.

Семантический трехмерный граф - это священный грааль для всех SEO оптимизаторов, точнее, был бы им, если бы они о нем знали. Но, увы, эти ребята слишком тупы чтобы уметь его добывать в исходном виде из недр статистики поисковых запросов вордстата. Хотя, некое его подобие они все таки вытаскивают в двумерном виде и называют это семантическим ядром. Но к семантическому графу это имеет весьма отдаленное отношение, потому что у трехмерного семантического графа во первых 3 координаты: частота поискового запроса, полнота поискового запроса, точность поискового запроса, а во-вторых, все 3 координаты имеют числовые характеристики.

Семантическое ядро seo оптимизаторов имеет лишь две из них: частота и точность. Полнота, как координата тут отсутствует, а значение координаты точности не определено. Т.е. это такой недограф и выглядит он тупо как список ключевых слов, отранжированный по убыванию частоты поискового запроса. Понятно, что применение такого недографа в продвижении сайтов не сулит больших перспектив заказчикам продвижения сайтов, ограничивая их в применении многих высокоэффективных технологий влияния на семантический фактор. Ну да ладно, оставим убогих и рассмотрим структуру семантического графа.

Он собирается поисковой системой из статистики вводов в поиск слов и фраз. Ведется подсчет каждого слова или фразы за месяц и таким образом получается координата частота. Вторая координата «точность» получается подсчетом того, сколько раз каждое из слов упоминалось совместно в текстах поисковых фраз. Например, отдельно слова «95-й» и «бензин» часто упоминаются вместе в одной фразе, а слова «мяч» и «кефир» вместе не упоминаются вообще никогда, и нет вообще такой поисковой фразы «мяч кефир».

Т.е. частота совместного употребления слов в поисковой фразе говорит о их логической БЛИЗОСТИ, или мере логической связанности, что одно и то же. Это и есть координата точности. Она показывает насколько точно связанные слова характеризуют их кучность если вам не нравится термин точность. Чем эта кучность больше, тем БЛИЖЕ оба этих слова будут в трехмерной структуре семантического графа как понятийные объекты.

В древовидном трехмерном классификаторе рядом стоящие понятия «95-й» и «бензин» отнесены к своим классам. 95-это вообще число и находится в классе «числа», а бензин это «углеводород», он находится совсем в другом классе, условно в километре по дереву от ветви с числами. Проводник потратит массу времени перемещаясь по дереву классов и подклассов, открывая все эти папочки, чтобы добраться из одного места в другое, т.е. склеивать смыслы друг с другом из отдельных запчастей, находящихся в разных концах классификатора сложно и долго, т.е. мыслить подобным образом долго и не эффективно.

Другое дело проводнику двигаться по графу, в котором рядышком и «95-й», и «бензин», и «квартал», и «зелннский». Все что нужно рядом, и проводник очень быстро все находит. В итоге скорость мышления на такой структуре максимальна. Но, только на популярных, типовых задачах, из которых и состоит в основном наше мышление. Оно применяет стереотипы и шаблоны, и если бы не они, гуманитарий бы зависал на каждой типовой задаче. А люди с математическим складом ума оптимизируют и без того быстрые процессы, что еще больше увеличивает их производительность. Поэтому это идеальные инженеры прикладники. Человеки оркестры, идеальные исполнители.

Не тормозят, не ошибаются, все делают быстро. Чудо а не сотрудники, великолепные тактики, а в сочетании с быстрой реакцией- идеальные спортсмены. Вот вам преимущества классификатора понятийной базы на графах. И это касается не только слов, но и всех остальных объектов понятийной базы: эмоции, звуки, ощущения.

И еще интересная ситуация с дублями в этой структуре. Если вдруг появляется новое сочетание (например с появлением «квартала 95», которого раньше не было), и связанные слова находились далеко в графе друг от друга, то алгоритм построения графа в вашей голове (а это программа автомат я напомню, она работает автономно) не задумываясь создаст дубль объекта «квартал» и расположит его близко к объекту «95-й», кучно к другим, с которыми применимость стала высокая.

А чтобы не путаться этот дубль с префиксом 1, т.е. квартал с префиксом 1. И таких кварталов в графе с разными префиксами может быть по числу контекстов, в которых это понятие применяется. Но круче всего эта штука с дублями и префиксами работает на математических задачах. Там в префиксы могут попадать целые формулы и математик при решении задач будет оперировать только ими, абстрагируясь от самого понятия в космос.

Поэтому когда физики математики что то там изобретают со своей квантовой теорией, и играются по сути с этими префиксами внутри своей головы, получив какой то интересный результат, совершенно не понимают к какому реальному физическому объекту он относится, он у них в голове может вообще сократиться как ненужный. Т.е. находятся в полной прострации, оттого никто не может ничего понять, потому что это противоречит всем нормальным представлениям о механике.

Цветной кварк, прелестный, спинон, тот что состоит из ориентаций. Т.е. полный отрыв от всего к чему привыкли нормальные люди с нормальным логическим мышлением и соответствующими ассоциациями касательно устройства сущего. Ну не может поместиться в голове гуманитария, что объект состоит из ориентаций или из цвета. Но математиков такое не парит от слова совсем.

В общем, для продвинутого математика крайне важны префиксы, символы функции, всевозможные знаки препинания, разделители и пр. служебные символы, которыми оперирует его мозг даже в большей степени, чем обычными классическими понятийными объектами. Продвинутый математик с чистой и развитой понятийной структурой на графах, не поймет смысла текста, если вы не там запятую поставите, поэтому именно математики так эмоционально реагируют на всякие грамматические и стилистические ошибки.

Вот кто такие математики.

Конечно, для контраста, я вам рассказал о чистокровных гуманитариев и математиков, это большая редкость. В основном понятийные структуры грязные, что у первых что у вторых, поэтому они внешне и в общении не слишком сильно отличаются. Это те самые 95% всех кто нас с вами окружает. Важно понимать, что каждый четко обладатель только одной структуры, они вместе друг с другом жить не могут.

Блюсти чистоту структуры своего мозга, к какому бы типу из 2-х она не принадлежала, -задача сложная и дорогого стоит.

Шизофреники, обладающие обоими структурами, имеют между собой какой то интерфейс обмена, но он жутко нестабилен. Это и вызывает припадки.