Найти тему

Может ли ИИ переводить литературу?

Оглавление

Искусство и язык всегда имели глубокую и сложную связь. Перевод литературы на другие языки — не простая задача. Это словно танец слов и чувств, а также культурных особенностей, стоящих за ними. Традиционно эта работа выполнялась опытными художественными переводчиками. Но с ростом популярности искусственного интеллекта (ИИ) и машинного перевода возник вопрос: может ли ИИ переводить художественные произведения?

В этой статье мы рассмотрим, как технологии пересекаются с творчеством, и как НМП используется для перевода литературы. Также попытаемся ответить на вопрос: может ли в самом деле ИИ уловить душу художественного произведения — или же при переводе некоторые нюансы будут теряться.

Сложности художественного языка

Искусство во всех его формах — это богатая палитра человеческого самовыражения. Будь то стихотворение, что вызывает эмоции, роман, что переносит в другую реальность, или фильм, который заставляет нас сидеть задумавшись некоторое время после титров — наше восприятие во многом зависит от языка автора. Но язык автора — это не только про слова. Это про умение передавать чувства, культурные нюансы и глубокие мысли.

Когда мы говорим о переводе литературных произведений, речь идет не о простой замене слов. Речь идет о задаче передать душу оригинала, представив его в другой форме. Возьмем, например, поэзию. Одна строка может содержать множество смысловых линий и культурных отсылок. Кроме того, у каждого произведения есть свой ритм, который необходимо сохранить. А что если учесть тот факт, что у разных народов разные представления о норме в поэзии? Например, в русской поэзии мы привыкли к рифме, а в испанской рифма не столь важна. Ее может не быть вовсе. Для испанской поэзии важен ритм, поэтому поэты придерживаются определенного количества слогов в строке. Перевести стихотворение на другой язык, учитывая все нюансы — вызов, который могут принять только действительно талантливые переводчики.

Известным примером книги, название которой при переводе было видоизменено, является роман Эриха Марии Ремарка «Der Himmel kennt keine Günstlinge» (дословный перевод «Небеса не знают фаворитов»), который на английский был переведен как «Heaven Has No Favourites» («У небес нет любимчиков»). Однако еще более интересным является случай с русским переводом этого романа, где название было изменено на «Жизнь взаймы». Это название — не просто перевод слов. Оно содержит в себе глубинный смысл произведения, акцентируя внимание на его экзистенциальных темах. Русское название подчеркивает быстротечность и хрупкость жизни. Это яркий пример того, как перевод становится актом толкования, когда переводчик принимает решения о том, какие аспекты оригинального произведения подчеркнуть.

Теперь представьте, что эту задачу выполняет компьютер. Несмотря на значительный прогресс нейронного машинного перевода (НМП) в переводе простых текстов, таких как новостные статьи или руководства по эксплуатации, художественный язык представляет собой совершенно иную историю. Тонкость метафор, игра слов и глубокий культурный контекст, стоящий за фразой, — это то, что машины часто не могут понять.

Как Iconclass улучшает переводы

Что такое Iconclass?

Iconclass — это известная система классификации для коллекций изображений и текстов, используемая в мире культурного наследия для описания и поиска сюжетов изобразительного искусства. По сути, это ресурс, который содержит ключевые слова и определения, позволяющие идентифицировать предметы, людей, события и идеи, показанные в произведениях искусства.

Как это помогает при переводе?

В ходе исследования команда изучила, как информация из системы Iconclass может повысить качество нейронного машинного перевода названий произведений искусства между голландским и английским языками. Извлекая ключевые слова и определения из Iconclass и включая их в процесс перевода, они стремились выяснить, может ли этот дополнительный контекст помочь ИИ выдавать более качественные результаты.

Результаты исследования

Исследователи установили, что общее качество перевода значительно улучшилось. Вот как это сработало:

  1. Лучшая идентификация именованных сущностей: модель распознавала важные имена и термины, которые не были напрямую упомянуты в оригинальных названиях произведений искусства, но присутствовали в данных Iconclass. Это позволило модели корректно вставлять эти ключевые элементы в переводы.
  2. Повышение лексической точности: дополнительная информация, предоставленная Iconclass, помогала модели более удачно выбирать слова, особенно когда в оригинальном названии не хватало контекста. Это сделало переводы не только более точными, но и более осмысленными и контекстуально верными.

В целом, это исследование показывает, что, грамотно интегрируя специализированные знания в машинный перевод, мы можем значительно улучшить результат, особенно в сложных и культурно насыщенных областях, таких как искусство.

Перевод литературы с использованием машинного перевода

Один из ключевых аспектов, который необходимо сохранять в любом переводе — это связность. Текст должен звучать естественно, чтобы быть убедительным и увлекательным. Прозаические литературные тексты, благодаря своему стилю и структуре повествования, более связны, чем тексты других жанров. Эта особенность делает их более трудными для систем машинного перевода.

Исследования показывают, что модели нейронного машинного перевода могут успешно переводить только около 30 процентов отрывков романов — как правило, более простые части — на уровне, приемлемом для носителей языка.

В исследовании, опубликованном в Scientific Bulletin of the Politehnica University of Timişoara, ученые изучили применение нейронного машинного перевода (НМП) для перевода литературных текстов. Исследование показало, что специально адаптированные системы НМП, обученные на литературных текстах, работают лучше, чем универсальные системы. Однако даже такие продвинутые системы пока не могут в полной мере передать когнитивную глубину и тонкость, присущие человеческому переводу. В результате переводы, выполненные НМП, часто требуют человеческой корректировки.

Исследование также предположило, что некоторые виды литературы, например японская поэзия хайку, могут быть легче для машинного перевода из-за их простой структуры и отсутствия метафор. Тем не менее, даже в таких случаях необходима человеческая проверка для обеспечения точности и культурной адаптации.

В исследовании 2018 года сравнивался перевод главы популярного фэнтези-романа Warbreaker (Убийца войн) с английского на каталонский с использованием фразового машинного перевода (ФМП) и нейронного машинного перевода (НМП) с последующей редактурой. Результаты показали, что обе формы машинного перевода увеличили производительность перевода. Редактирование также привело к сокращению количества нажатий клавиш на 6% и 23% соответственно. Что касается когнитивных затрат, редактирование привело к уменьшению количества пауз (на 29% и 42% соответственно), но сами паузы стали длиннее (на 14% для ФМП и на 25% для НМП).

Хотя эти впечатляющие результаты показывают, что нейронный машинный перевод в сочетании с человеческой редактурой быстрее, чем перевод с нуля, до автоматического перевода целых романов, таких как Гарри Поттер, ему еще далеко.

Серия книг Гарри Поттер представляет собой особенно сложную задачу из-за своей лексической насыщенности, которая вызывала трудности даже у профессиональных лингвистов. В итальянских изданиях, например, названия факультетов были изменены на комбинации животных и цветов: Gryffindor стал Grifondoro («Золотой грифон»), Slytherin — Serpeverde («Зеленая змея»), Ravenclaw в первом издании первой книги был переведен как Pecoranera («Черная овца»), но позже исправлен на Corvonero («Черный ворон»), а Hufflepuff получил название Tassorosso («Красный барсук»).

Заключительные мысли

Несмотря на значительный прогресс нейронного машинного перевода, очевидно, что перевод литературных текстов остается сложной задачей, которую машины пока не могут полностью решить. Оптимальным подходом представляется совместная работа, где люди используют инструменты машинного перевода для создания наиболее точных и культурно адаптированных переводов.

Машинный перевод Lingvanex может стать отличной отправной точкой для работы профессионалов. Партнерство, при котором объединяются человеческий опыт и скорость машин, вероятно, и станет будущим литературного перевода, где технологии помогают, но не заменяют уникальное человеческое мастерство, необходимое для развития многоязычной литературы.