Найти тему
Душкин объяснит

Китайский язык и Искусственный Интеллект. Часть 6

Китайский язык не отпускает, так что продолжим. Шестой день, полёт нормальный. Сегодня я хотел бы подвести черту под семантикой, которую я обнаружил в этом удивительном языке, который в XXI веке пользуется столь архаичной системой письма, что это реально тормозит развитие общества.

Изучив систему иероглифов я нахожу, что можно выделить четыре уровня семантики в китайском языке, из которых только четвёртый знаком нам по нашим обычным языкам, а остальные связаны с их странной письменностью. Но перед тем, как я распишу эти четыре уровня, напомню про то, что в китайском языке есть четыре тона. Один и тот же слог может быть произнесён четырьмя различными способами, и это влияет на его смысл. Смотрите:

妈 = mā = мать
麻 = má = конопля
马 = mǎ = лошадь
骂 = mà = проклятие

Несмотря на то, что в двух из четырёх иероглифов в этом примере используется один и тот же фонетик, который является третьим иероглифом в наборе, смысл каждого из четырёх знаков и слов совершенно различный и друг с другом не связанный. А для неподготовленного русского уха все четыре слога будут звучать примерно одинаково ну просто потому, что в русском языке тон не несёт смыслоразличительного значения.

Но заметьте, слог и для китайца один и тот же. Он состоит из двух звуков — М и А, несмотря на то, что они произносятся разным тоном. С точки зрения программы активации нейронов для произнесения этих слогов надо активировать одинаковые нейроны, как минимум в начале произнесения. А это значит, что в терминах нейронных сетей эти слоги и за ними знаки и смыслы являются связанными друг с другом. То есть для китайца из-за вот этой особенности языка на нейрональном уровне есть связь между мамой, коноплёй, лошадью и проклятием. Возможно, даже, неосознаваемая связь.

А теперь уровни семантики:

1) Вот эта самая связь между одинаковыми слогами в разных тонах.

2) Связь между понятиями, обусловленная вхождением фонетика и ключа в состав составного иероглифа.

3) Связь между сложным понятием и двумя его простыми составляющими для двуморфемных слов (компьютер = электричество + мозг).

4) Обычная для нас ассоциативная связь между понятиями, когда одно понятие определяется через другие. Но тут тоже есть нюанс, который я рассмотрю позже.

Ну а в следующий раз я напишу вам про то, к каким последствиям с точки зрения когнитологии приводит наличие иероглифической системы письма в китайском языке для носителей этого языка, впитавших его с молоком матери.

Предыдущие выпуски нашей стенгазеты:

1) Начало: зачем всё это и причём тут Искусственный Интеллект.
2)
Векторная семантика: как составные слова получают свой смысл.
3)
24 черты китайских иероглифов: о том, как сложно учить этот язык.
4)
Компьютер = электрический мозг: как китайцы воспринимают ИИ.
5)
Простые и составные иероглифы: как создаются новые иероглифы.