Найти в Дзене
Душкин объяснит

Китайский язык и Искусственный Интеллект. Часть 5

Ну что ж. Мой пятый день изучения китайского языка и китайской грамоты. Всё идёт по плану. Изучил уже пару десятков иероглифов, что и было (и остаётся) моей первоначальной целью. Но, к моему удивлению, изучение произношения тоже идёт очень даже неплохо. Я помню, как в начальной школе меня просто выбешивали тоны, я вообще не понимал, как произносить китайские слоги. Но тогда у меня не было смартфона, специального приложения и Youtube, а только бумажный учебник. Сегодня изучать языки намного проще. Я завидую современной молодёжи — мотивированные ребята и девчонки имеют такие возможности для взлёта, какие нам и не снились.

Что интересного я нашёл для вас ещё? Все китайские иероглифы можно разделить на две большие категории — простые и составные. Китайские филологи и всякие востоковеды могут придумывать и другие схемы классификации, но это всё неважно. Итак, две категории — простые и составные. Это всё, что нас сейчас интересует.

Простые иероглифы — простые. Их нельзя разделить на составляющие части. Они могут состоять из произвольного количества черт, от этого не зависит их простота. Главное, что они воспринимаются как единое целое.

Составные иероглифы состоят из двух простых. Но это не два слога, это именно один иероглиф, который традиционно вписывается в квадрат. Просто в один квадрат вписывается два иероглифа, соединённых (и иногда даже переплетённых) вместе. Из этих двух простых иероглифов один называется фонетиком, а другой — смысловыми ключом или просто ключом. Фонетик определяет, как читается иероглиф, и чаще всего не имеет никакого отношения к его смыслу. А вот ключ как раз определяет смысл иероглифа, его семантическое «гнездо». Итого — фонетик задаёт способ чтения, а ключ определяет смысл. Таким образом из двух простых иероглифов получается один сложный. Но в процессе развития языка первоначальные значения ключей постепенно расходились, и сегодня можно найти составные иероглифы, смысл которых имеет мало общего с семантикой ключа.

Например: 妈 — это составной иероглиф, который переводится как «мать». Он состоит и фонетика 马, который читается как «ма» в третьем тоне и переводится как «лошадь», и ключа 女, который читается как «ню» в третьем тоне и переводится как «женщина». Итог: иероглиф 妈, который читается как «ма» в первом тоне и имеет какое-то отношение к женщинам. То есть «лошадь» здесь только для того, чтобы итоговый иероглиф читать как «ма». И все составные иероглифы построены примерно по такой вот логике.

В языке имеется несколько сотен простых иероглифов, которые могут выступать ключами в составных иероглифах. Их просто надо запоминать. Но факт тот, что при обучении китайской грамоте (в том числе и Искусственного Интеллекта) этот принцип вполне можно взять на вооружение и использовать в качестве ещё одного уровня семантики. Но, конечно, с большой осторожностью. Но и ещё, конечно, есть проблема в том, что для заданного составного иероглифа по его виду часто нельзя сказать, какая часть является фонетиком, а какая ключом — это надо помнить. А к чему это приводит в головах у носителей с точки зрения когнитологии (и, возможно, нейрофизиологии), мы поговорим в следующий раз...

Предыдущие части этого сериала:

1) Начало: зачем всё это и причём тут Искусственный Интеллект.
2)
Векторная семантика: как составные слова получают свой смысл.
3)
24 черты китайских иероглифов: о том, как сложно учить этот язык.
4)
Компьютер = электрический мозг: как китайцы воспринимают ИИ.