Рассмотрим информационные возможности в представлении знаний на примере русского языка. Сколько слов возможно в русском языке? Для этого нам необходим параметр, касающийся количества букв в алфавите. Если отбросить букву «ё» (которая почти не употребляется), то это 32. Следующий показатель – это среднее количество букв, составляющих слово. Статистический анализ текстов показывает число 6. Из комбинаторного анализа вытекает, что количество слов в русском языке составляет 32 в 6 степени, и приблизительно оценивается как 10 в 9 степени, т.е. миллиард. Из них в обыденной жизни человек употребляет всего около 7 тысяч слов. В толковых словарях их количество не превышает 10 в 5 степени. Дополнительных 4 порядка – это резерв языковой системы для описания действительности.
Следующим уровнем языковой системы является предложение. Для выяснения вопроса, сколько предложений возможно в русском языке, необходимо знать, сколько в среднем слов присутствует в предложениях. Статистический анализ показывает, что их тоже 6. Следовательно количество предложений в русском языке может составить астрономическую цифру 10 в 54 степени. Достаточно отметить, что количество атомов в нашей Вселенной составляет 10 в 80 степени.
Расчеты показывают, что русский язык обладает огромной информационной избыточностью и имеет колоссальный резерв для будущего развития человечества.
Исходя из количества осмысленных слов, т.е. имеющих семантическое значение в русском языке, оценка количества осмысленных предложений составляет 10 в 30 степени. Если учесть, что количество электронов находящихся в земном шаре выражается числом 10 в 40 степени, то становится понятным, что количество предложений составленных из 32-буквенного алфавита представляется просто огромным, и хотя определённое количество фраз может не иметь смысла, или в них не выполняются грамматические правила, оставшихся вполне достаточно для выражения обширного разнообразия человеческих мыслей.
Анализ структуры русского языка показывает её жесткую детерминированность, которая исходя из вычисления показателя Шеннона составляет 80%. В то время как 20% приходится на вариабельность, своего рода случайностей, обеспечивающих развитие языковой системы.
По современным данным количество языков на нашей планете составляет около 7 тысяч. Почему их так много, и существует ли древний праязык, на котором разговаривали в прошлом? Революцию в лингвистике произвёл американский учёный Ноэм Хомский. Его идея заключалась в том, что язык во многом определяется нейробиологической структурой мозга, которая практически универсальна у всех людей. Лишь её проявления носят вариабельный характер. Если выделить эту праструктуру языка и разобраться в механизмах её трансляции, то тогда перевод с языка на язык можно осуществлять автоматически, даже не зная самого языка. По мнению лингвистов для того, чтобы сделать это необходимо объединить 20 специалистов, которые знают 100 языков. Такие люди есть на нашей планете, но собрать их вместе, чтобы вычленить эту структуру пока не удается.
Отчасти идеи Хомского подтверждает гипотеза, согласно которой еще 6 тысяч лет тому назад люди разговаривали на одном языке. Но последующие катастрофы и серии мутаций привели к разобщённости людей и генетическим изменениям. Мир языковых реальностей стал разнообразным.
Определяет ли язык ход мыслительных процессов? При рассмотрении этой проблемы сложились два подхода, получивших название жёсткого и относительного лингвистического детерминизма. Представители идеи жёсткого лингвистического детерминизма, американские лингвисты Эдвард Сепир и Бенджамен Уорф пришли к выводу, что тип языка однозначно определяет мировосприятие индивида, а также его интеллектуальную сферу. С их точки зрения перевод с языка на другой язык вообще невозможен, настолько это разные миры.
Сторонники относительного лингвистического детерминизма занимают более гибкую позицию, признавая воздействие языка на мыслительные процессы. Они считают, что это влияние не столь жёстко детерминировано, но тем не менее оно присутствует.
Европейским учёным потребовались чудовищные усилия по разработке теории теплоты. Они искали существенную субстратную основу (поскольку в европейских языках теплота это существительное), формулируя теории флогистона и теплорода. Возможно, если бы они разговаривали на языке индейцев племени хопи, они сразу бы пришли к кинетической теории теплоты. Поскольку в языке хопи существительных почти нет, и доминируют глагольные формы. А теплота – это процесс, средняя энергия движущихся молекул.
Язык является системой, через которую мы узнаём о субъективном мире людей. Через него можно изучать интеллект и его активность, проявляющуюся в виде мышления. Вскрытие единой структуры праязыка откроет возможности декодирования мозга, лучшего понимания механизмов мышления и трансляции информации. Это позволит получить новые фантастические возможности в сфере искусственного интеллекта, к которым в том числе относится и проблема перевода текстов на другие языки.
Платформа Дзен по определённым причинам меняет алгоритмы показов. Если вы уверены, что подписаны на канал рекомендуется проверить это в связи с возможной автоматической отпиской.
Также материалы по теме «Загадки мозга и искусственный интеллект»: