Найти тему
Душкин объяснит

Китайский язык и Искусственный Интеллект. Часть 27

Продолжаю учить китайский язык. Заодно начал читать книгу Лю Цысиня «Задача трёх тел». Ну так себе, однако расширенную рецензию напишу чуть позже. Сегодня расскажу про забавный случай, который у меня произошел в связи с этим.

В книге есть эпизод, когда один из главных героев открывает страницу в интернете. И в книге приведён URL этой страницы. Ну я его открыл тоже, а там действительно страница, которая была описана в книге (в этом ничего удивительного, многие авторы сейчас используют такую омниканальность воздействия на читателя; я тоже — вы уже купили книгу про искусственный интеллект?).

И у страницы есть заголовок: 莫尔斯电码. Забавно то, что я уже знаю, как читаются все пять приведённых иероглифов. И я попробовал прочитать: mò'ĕrsīdiànmă. Разобрал на слова: mò'ĕrsī diànmă. Понял смысл: «азбука Морзе», причём самих слов я не знал, знал только значения каждого отдельного иероглифа: (никто) + (тот) + фонетик = Морзе; (электричество) + (цифра) = код. В слове «Морзе» все три иероглифа чаще всего используются как фонетики, то есть специальные знаки, предназначенные для передачи слов из варварских языков. В общем, я смог понять смысл заголовка без обращения к словарю, зная только то, как читаются иероглифы, и зная их смысл.

И я возликовал. Я подумал было, что моя первоначальная гипотеза о том, что китайский язык ограничивает его носителей, не верна. Я же смог понять смысл фразы, зная только то, как читается и что значит каждый иероглиф по отдельности. То есть у поморского крестьянина из далёкой архангельской глубинки есть шанс основать академию наук.

Однако потом я понял, что это не так. В моей голове уже слишком много всего, и перевод я сделал, используя свой багаж знаний, полученный из другой языковой среды. Я знаю, что такое «Морзе», я знаю, что такое «азбука» или «код», что по смыслу наиболее всего подходит под понятие «электрическая цифра». Если бы я был крестьянином, овладевшим базовыми тремя тысячами иероглифов, я бы в душе не чаял, что же это за электрическая цифра такая. Даже не электрическая, а та, что связана с молнией, ибо «молния» — это базовый смысл иероглифа 电, доступный крестьянину через его непосредственное восприятие реальности. «Цифра-молния»? Нет, не знаю.

В общем, моя гипотеза не очень-то и поколебалась. Продолжаем исследования...

Предыдущие выпуски нашей стенгазеты:

1) Начало: зачем всё это и причём тут Искусственный Интеллект.
2)
Векторная семантика: как составные слова получают свой смысл.
3)
24 черты китайских иероглифов: о том, как сложно учить этот язык.
4)
Компьютер = электрический мозг: как китайцы воспринимают ИИ.
5)
Простые и составные иероглифы: как создаются новые иероглифы.
6)
Четыре уровня семантики: какие есть связи между иероглифами.
7)
Глокая куздра: как китайский язык ограничивает развитие человека.
8)
Новые слова и концепции: о том, как создаются новые слова.
9)
Таблица иероглифов: инструмент для тех, кто изучает язык.
10)
Гипотеза Сепира-Уорфа: действительно язык определяет восприятие.
11)
Разбор потока иероглифов: как распознавать многоморфемные слова.
12)
Полуторный уровень смысла: из чего же состоят иероглифы.
13)
Треугольник Фреге: из чего состоит знак.
14)
Инструментарий: чем я пользуюсь для изучения языка.
15)
Расширенный треугольник Фреге: расшифровка семиотики языка.
16)
Схлопнутый треугольник Фреге: некоторые странные варианты.
17)
Нейронные связи китайца: что в голове у носителя языка.
18)
Нейронные связи некитайца: что в голове у тех, кто изучает язык.
19)
Нихао: почему двухморфемные слова можно произносить без тонов.
20)
Многие ко многим: продолжение про двухморфемные слова.
21)
Первая проблема: как иероглифы начинают сливаться.
22)
Игра «лепестки»: первая словесная игра в иероглифы.
23)
Китайские тезаурусы: как иероглифы определяются через иероглифы.
24)
Иероглиф : как кодируются семантические отношения в голове.
25)
Первые слова о синтаксисе: о регулярном словоизменении.
26)
Связь между чтением и письмом: сложно писать, умея распознавать.