Добавить в корзинуПозвонить
Найти в Дзене

Первые трудности в переводах старых текстов

У меня нет лингвистического образования, но английский язык мало изменился за прошедшие пару веков, потому я был уверен, что без особых проблем смогу перевести старые английские тексты. Это же не русский, в котором благодаря реформе языка 1918 года были упразднены ѣ (ять), ѵ (ижица), ѳ (фита) и і (десятеричное "и"). Однако даже прочитать текст 1740 года без труда не получилось. Текст английского джентльмена Уильяма Уиндхэма (William Windham) добавил пару фактов, о которых я прежде не знал и не думал. Для начала я весь текст загружаю в ИИ, чтобы он сделал мне перевод, и лишь после правлю ошибки. И вдруг, в переводе во время горной экспедиции появились «скаковые лошади». Что за нонсенс? Пришлось искать фразу, которая послужила источником перевода. Оказалось, фраза была Sumpter horses. Sumpter – архаизм, устаревшее слово, «вьючное животное». Но автоматический переводчик не знал его и подобрал ближайшее понятие, которое смог применить к лошади – скаковая. Но еще прежде с текстом Уиндхэма в

У меня нет лингвистического образования, но английский язык мало изменился за прошедшие пару веков, потому я был уверен, что без особых проблем смогу перевести старые английские тексты. Это же не русский, в котором благодаря реформе языка 1918 года были упразднены ѣ (ять), ѵ (ижица), ѳ (фита) и і (десятеричное "и"). Однако даже прочитать текст 1740 года без труда не получилось.

Текст английского джентльмена Уильяма Уиндхэма (William Windham) добавил пару фактов, о которых я прежде не знал и не думал.

Для начала я весь текст загружаю в ИИ, чтобы он сделал мне перевод, и лишь после правлю ошибки. И вдруг, в переводе во время горной экспедиции появились «скаковые лошади». Что за нонсенс? Пришлось искать фразу, которая послужила источником перевода. Оказалось, фраза была Sumpter horses. Sumpter – архаизм, устаревшее слово, «вьючное животное». Но автоматический переводчик не знал его и подобрал ближайшее понятие, которое смог применить к лошади – скаковая.

Но еще прежде с текстом Уиндхэма возникла другая сложность. В XVIII веке при печати в английском алфавите использовали иные символы – это я узнал только благодаря дополнительным запросам в поисковиках. Буквы J и U уже существовали, но еще сильно зависели от своих «родителей», литер I и V. Долгое время I и J считались вариантами одной и той же буквы, а в словарях начала XVIII века слова на эти буквы шли в одном общем списке. Так же, как и слова на буквы U и V. Поэтому и в написании они иной раз подменяли друг друга.

Но самая большая трудность была с буквой ſ. Я не лингвист, и про ее существование даже не знал. OCR текста (Optical Character Recognition, Оптическое Распознавание Символов) автоматом присваивало этой букве значение f, наиболее близкой по начертанию буквы из современного алфавита. При этом ſ – это длинное s, т.е. распознанный текст не только «шепелявил», но и полностью подменял значения слов. Пришлось через автозамену ставить ss вместо f в середине слов, а затем уже руками править обратно на f в знакомых словах. Благо текст сочинений XVIII века сильно короче тех же горных отчетов века XIX или XX (грамотных было меньше, чтению уделяли еще не так много времени).

PS: в процессе поисков информации про английский алфавит XVIII века я узнал происхождение слова «амперсанд». В школьных букварях XVIII и начала XIX веков символ & часто ставился в самом конце алфавита как 27-й знак. И дети, заучивая и рассказывая алфавит, заканчивали его словами: «...X, Y, Z, and per se and». Из этой фразы («and per se and» – что значит «и (символ) сам по себе "и"») позже возникло слово ampersand.

PPS: и еще одно открытие – немного стыдно, что узнал только теперь – иногда встречающаяся в текстах пометка (sic), это латинское слово sic («так, именно так»). Ее редактор вставляет в цитату, чтобы показать: странное или ошибочное написание/формулировка сохранены точно, как в оригинале, а не появились по вине текущего набора. В примечаниях и цитатах (sic) означает: «так и было написано в источнике». Это может относиться к орфографии, грамматике, фактической ошибке или просто очень необычному обороту – редактор фиксирует, что он цитирует добросовестно.