H Y P O T E X T

29 мая 202129 мая 2021

8 мин

Иногда, проявляя любопытство в самых поверхностных вещах, мы находим совершенно неожиданные идеи. Так несколько дней назад я случайно нашел короткое видео, демонстрировавшее принцип работы японской печатной машинки. Она имела своеобразный вид, и, скорее, ее можно было назвать печатным аппаратом, а не машинкой – слишком уж условна была механизация печати на этом устройстве. Рабочее поле представляло собой барабан, на котором с помощью механического курсора выбирался нужный иероглиф, нажимался рычаг, и – voila – на бумаге получался оттиск. Выглядит не слишком быстро, не так ли? Скажем так - даже не слишком индустриально. Решение задачи скоростной машинописи явно было за пределами ее возможностей.

Стоит сказать о том, как процесс печати иероглифов выглядит сейчас.

Наверное, многие догадываются, что люди, независимо от используемого языка используют одни и те же клавиатуры на компьютерах, или, допустим, на мобильных устройствах. На них совершенно точно нет места для тысяч иероглифов. Так как же решается эта проблема?

Наиболее популярным является фонетический метод – в китайском это Pinyin – при котором вводится не сам иероглиф, а его произношение. Таким образом, можно использовать вполне обычную латинскую клавиатуру и знание правил транскрипции иероглифов на английский.

При кажущейся простоте и естественности этого метода, в тонком корпусе компьютерной деки должны произойти сопоставления введенных символов с базой из 70000 иероглифов с предоставлением в итоге десятка подходящих вариантов, а, в идеале, даже единственного, на который укажет предиктивная система. Очевидно, что решить этот вопрос не так-то просто механическими методами, а до появления компьютерных систем ввода прошли десятилетия. При этом, новый технологический уклад требовал создание огромного массива печатной информации – писем, документов, проектных и технологических материалов, статей, книг.

Конечно, я сразу подумал, что Япония не единственная страна, которая должна была столкнуться с проблемой реализации печатного ввода в ходе научно-технической революции: Китай, Корея, и, наверное, десяток других стран, имеют нестандартную письменность, которую сложно реализовать на привычном печатном механизме, приспособленном для латинского алфавита.

Youtube услужливо предложил несколько вариантов ответов на этот вопрос, среди которых наиболее близкой мне была «История создания китайской печатной машинки», ведь я некоторое время изучал китайский. И я не прогадал. Оказалось, что вопрос развития печати в восточных языках намного глубже и охватывает обширный круг вопросов развития не только языка, но и общества.

История создания китайской печатной машинки (The Chinese Typewriter: A History) – лекция Тома Маллэйни (Tom Mullaney) – профессора истории Университета Стэнфорда, основанная на его одноименной книге (издана MIT Press 2017).

Как это часто бывает у хороших авторов и увлеченных ученых, в процессе лекции вскрывается множество межпредметных связей – язык, способы ввода, анализ информации, когнитивные изменения. Лекция Маллэйни действительно является хорошим образцом лекции как таковой по структуре, содержанию, подаче материала и нетривиальности выводов, а также по работе с аудиторией.

Лекция интересна сама по себе, но для тех кому не хочется долго смотреть (тем более на иностранном языке, как ни крути, делать это все же не так приятно), и тем, для кого письменный текст воспринимается лучше, а также для того, чтобы не забыть самому, я выписал и аккумулировал самые интересные тезисы этой лекции.

Итак, какими же интересными фактами и выводами делится с нами Томас Маллэйни:

· Повседневный язык половины населения земли в реальности исключен из обычной логики промышленного печатного письма (арабский, индийские, корейский, китайский, японский и прочие языки), поскольку не выполняются типичные условия для (латинского) машинописного письма, а именно:

o Автоматический переход к следующей позиции после печати символа

o Расположение символов на одной линии (строке)

o Изоморфизм – символы не меняют форму и размер (арабский – форма букв меняется в зависимости от положения в тексте, в корейском меняется размер и форма глифов и т.д.)

o Изоляция (символы не соединяются друг с другом)

o Монопространство – каждый символ занимает отдельное место

o Направление печати слева направо

Подобные исходные условия языка и способов ввода приводят к вполне понятным когнитивным особенностям при работе с подобными устройствами, привычным и для нас:

o Присутствие (Presence) – пользователь видит буквы алфавита, которым он печатает, на клавиатуре

o Что ты печатаешь, то и получаешь

o Завершенность – когда ты печатаешь слово, возможность его набор инвариантна – всегда один и тот же набор букв в одинаковом порядке

· В 1860-1940х возник кризис языков, не подходивших под модель западного машинного письма, что затормаживало развитие индустриальных обществ и спровоцировало массовые реформы письма, направленные на соответствие западным технологическим стандартам

· Указанная проблема решается за счет распространения гипографического письма (термин вводит сам Маллэйни). По сути – это квазитекст, создающийся при использовании Input methods editors (IME) на цифровых устройствах ввиду невозможности прямого ввода символов и их упрощения фонетическими (пишутся звуки) или структурными методами (разбиение символов на составляющие, неполный ввод)

· Простейшая метафора для Гипотекста – это электронные музыкальные инструменты. Звук музыкального инструмента неразрывно связан с его физической природой. С появлением электронной музыки извлечение звука любого инструмента может быть осуществлено, к примеру, за счет нажатия на клавиши запрограммированной MIDI-клавиатуры. Больше нет физической связи между физической природой инструмента и извлекаемым звуком. Аналогично Гипография делает с языком

· Использование подобного метода письма приводит к существенным когнитивным изменениям для пользователя:

o То, что ты печатаешь, не то, что ты получаешь

o Нет прямой связи между тем, что вводишь и тем, что получаешь

· Использование гипографического письма приводит к когнитивным нарушениям у миллионов молодых людей в Китае. Так, используя распространенные Input methods editors (IME) на цифровых устройствах, молодые китайцы не могут написать иероглиф без систем ввода (в частности 1% элиты и их детей, чем богаче, тем чаще встречается – ввиду тотального использования цифровых устройств для создания текста)

· Это считается когнитивной дисфункцией. Это называют «Character Amnesia», «Dysgraphia», «Illiteracy». Сами китайцы называют это tibi wangzi (提笔忘字) – «To lift one’s brush, but forget the character»

Какие же перспективы имеет неизбежное развитие гипографического письма?

· Потребителями Гипографического метода ввода являются более 50% населения Земли

· Продолжится формализация и упрощение символов. Это перезапускает эволюцию письменности - все можно превратить в квазитекст

· Больше не требуется полнота ввода информации для печати полноценного слова и текста. Возникает когнитивный разрыв между написанием текста и его прочтением (и это очень интересный в перспективе момент, возможно, это потребует перестроения и упрощения самого языка или способов его чтения)

· Мы рядом с эпохой новой формы письма, наш словарь и теоретические модели остаются связанными старыми формами и поэтому появляются такие проблемы, как Character Amnesia

· В настоящее время предиктивные системы пытаются понять, не какой символ ты хочешь ввести (это было достигнуто в 50-е 60е), не какой следующий символ ты хочешь ввести (60-70-е), сейчас он предполагает все слово, предложение или даже текст.

· В перспективе это приведет к тому, что граница между написанным и ненаписанным текстом начинает стираться

И еще весьма и весьма интересные факты об эволюции языков и развитии способов печати в Китае:

· Западные фирмы-производители печатного оборудования не смогли создать печатную машинку на китайском с привычной для нас клавиатурой

· В корейском иероглифы разбили и поместили их части в одну линию для адаптации под печатные машинки

· Китайцы впервые в мире провели частотный анализ повторяемости символов в письменной речи. Они делали это на протяжении десятилетий

· Было выявлено, что ядро языка включает 2500 иероглифов из имеющихся 70000

· Эти иероглифы составляют 90%+ от всех используемых в письме

· Из этих символов и состояло рабочее поле первых печатных машинок (а скорее наборных устройств)

· Китайцы впервые сделали тепловую карту ассоциированных иероглифов, комбинирующихся друг с другом

· С учетом комбинирования было перестроено рабочее пространство печатных машинок. Это называлось Lianxiang ( или Lenovo!)- организация связанных мыслей

· Рабочее поле состояло из 2500 наиболее часто встречающихся иероглифов 90%+

· Печатные машинки были индексными (нужно было механически выбирать каждый иероглиф из тысяч в рабочем поле). Поскольку ядро языка менялось, менялся и состав иероглифов. Язык менялся и ядро основных иероглифов менялось, с учетом этого модернизировали печатные машинки

· Обучение печати основывалось не на знании точного местоположения иероглифа в рабочем поле, а на знании окружения, в котором искомый иероглиф будет находиться, запоминались наиболее распространенные комбинации слов (т.н. словесная геометрия)

· 1947 была изобретена первая печатная машинка на китайском с клавиатурой Mingkwai

· Логика машины исключала два из трех основных признаков латинской машинной печати – непосредственное наличие вводимых букв, связь между нажатием и печатью

· Ранние системы ввода были структурными, основанными на строении иероглифа, а не на его звучании и произношении

· Обнаружилось, что для однозначного определения иероглифа, при структурных методах ввода достаточно было ввести лишь часть необходимых черт (иероглиф из 12 черт мог быть автозаполнен при введении всего 3 черт) - Samuel Hawks MIT logical circuit design

· В Китае стали учить пиньину с 50-х, до этого учили вуби, основанном на написании иероглифов