Профессия постредактора машинного перевода набирает все большую популярность. На фоне противоречивых мнений общественности о явлении машинного перевода как такового прогнозы руководителей переводческих компаний на ближайшие несколько лет выглядят вполне однозначно: современному специалисту в области перевода будет не обойтись без навыков постредактирования МП.
Информации по теме в русскоязычном интернете не так много, как хотелось бы, ее приходится собирать по крупицам. У исполнителей и заказчиков могут быть разные ожидания от процесса и результата. Данная статья представляет собой своеобразный гид в мире постредактирования, помогает получить базовые знания для входа в профессию и упорядочить их.
Вводная информация
PEMT (postediting machine translation) или постредактура машинного перевода представляет собой процесс переработки машинного перевода и его доведения до ожидаемого уровня качества.
Можно догадаться, что ожидаемый уровень качества — это такое обтекаемое понятие. При описании процесса постредактирования в основном используются как раз такие формулировки. Причина, как было сказано выше, кроется в отсутствии универсальных требований, применимых к каждому конечному продукту.
Тем не менее, специалисты выделяют набор руководящих принципов постредактирования. Постредактирование выполняется а) с помощью минимальных усилий, б) за минимальное возможное количество времени, в) с целью получения максимального результата. Следующая схема демонстрирует эту зависимость.
Регламентирующие документы
Хорошие новости: профстандарт существует. Международный стандарт по предоставлению услуг машинного редактирования ISO 18587:2017 (Translation Services – Post-editing of machine translation output – Requirements. International Organization for Standardization) описывает возможные уровни качества МП, а также варианты постредактирования.
Кроме того, схожую функцию выполняет руководство по постредактированию машинного перевода Общества пользователей автоматического перевода TAUS (Translation Automation User Society) Machine Translation Post-editing Guidelines.
Уровни качества и варианты редактирования МП
Определимся с уровнями качества перевода (всего их два).
Первый уровень качества, good enough quality («приемлемое» качество), предполагает проработку лексических и грамматических ошибок, а также проверку соответствия терминов их машинному переводу и доперевод непереведенных слов при их наличии.
Согласно TAUS, для достижения «приемлемого» уровня качества постредактор должен убедиться, что:
· перевод является корректным с точки зрения семантики;
· в переводе нет случайных добавлений или опущений;
· перевод не содержит оскорбительного или неприемлемого с точки зрения культуры контента;
· результат МП используется по максимуму;
· соблюдены основные правила орфографии;
· текст редактируется только когда это нужно для понимания, избегаются субъективные коррекции стилистических ошибок;
· максимально сохраняется порядок слов, предложения не меняются местами (допускается наличие неестественно звучащих предложений).
Второй уровень качества, publishable quality/quality similar or equal to human translation (качество, отвечающее предъявляемым к публикации требованиям/соответствующее традиционному переводу) предполагает проработку текста практически на всех лингвистических уровнях: грамматическом, лексическом, синтаксическом и стилистическом.
Согласно TAUS, для достижения такого уровня качества постредактор должен убедиться, что:
· перевод является корректным с точки зрения грамматики, синтаксиса и семантики;
· термины переведены правильно (а также соблюдено единообразие терминологии — прим. автора);
· в переводе нет случайных добавлений или опущений;
· перевод не содержит оскорбительного или неприемлемого с точки зрения культуры контента;
· результат МП используется по максимуму;
· соблюдены основные правила орфографии, пунктуации и переносов;
· форматирование текста является корректным.
Варианты постредактирования коррелируются с уровнями качества (их также два): light post-editing (легкое постредактирование) и full post-editing (полное постредактирование).
Специалисты PROMT даже различают стратегии постредактирования МП по объему постредактирования в процентах (~100, 80, 60, 35, 20, где 100% соответствует полному редактированию, 80% — МП используется в качестве подсказки по терминологии, 60% — МП используется в качестве грамматического подстрочника, 35% — анализ сомнительных мест с обращением к исходному тексту, 20% — корректура или исправление очевидных погрешностей без обращения к исходному тексту).
Немного цифр
С постредактированием скорость перевода может возрасти в 2,5 раза по сравнению с традиционным переводом. Экономия времени на перевод составляет в среднем 50%.
Специалисты MemSource приводят такой пример: при скорости перевода 2 000 слов в день скорость постредактирования составляет 4 000 слов в день и достигает до 8 000 слов в день при владении навыками эффективного постредактирования.
Важно понимать, что эти значения могут меняться в зависимости от объема, предназначенности текста, требований к качеству, ожиданий заказчика, времени и проч.
По моим личным ощущениям, МП стоит использовать как основу для постредактирования тогда, когда объем постредактирования составляет до 40%. В остальных случаях МП можно использовать как подстрочник для справки.
Актуальное руководство постредактора машинного перевода
Специалисты MemSource выделяют следующие распространенные ошибки пост-редакторов:
· субъективные стилистические исправления;
· недостаточно отредактированные переводы;
· избыточно отредактированные переводы;
· неверное употребление терминов, несоблюдение единообразия терминологии;
· наличие непереведенных слов, добавлений и опущений;
· неверная передача аббревиатур;
· наличие нелокализованного текста;
· опечатки;
· буквальный перевод или «ложные друзья переводчика»;
· ошибки на уровне структуры;
· наличие машинных неологизмов (несуществующих слов).
Я бы добавила в этот список пункты «грамматические ошибки (согласование по лицам, числам и падежам)», «очевидные логические ошибки», «несоблюдение единообразия употребления единиц измерения и повторяющихся конструкций», «неверная транслитерация или буквальный перевод имен собственных», «нарушение типографических норм для специальных символов (тип кавычек, тире и проч.)» — прим. автора.
…а также дают следующие рекомендации по проработке таких ошибок:
· исправляется любой термин, неверно употребленный в тексте (технический или нетехнический), исключается несоблюдение единообразия терминологии;
· исправляется любая синтаксическая ошибка (нарушение правил употребления частей речи, разрушение структуры фразы, неправильный порядок слов и фраз);
· исправляется любая морфологическая ошибка — неверные формы слов (число, род, падеж, лицо, время, наклонение, залог и проч.);
· исключаются любые опущения (абзаца, предложения, фразы, слова), которые мешают восприятию смысла исходного сообщения;
· исправляются любые опечатки;
· исправляются ошибки пунктуации, которые мешают восприятию смысла исходного сообщения;
· допускается наличие стилистических ошибок, которые не мешают восприятию смысла исходного сообщения;
· не допускается наличие оскорбительного или неприемлемого с точки зрения культуры контента.
На основе этих данных можно составить техническое задание для каждой отдельной языковой пары с учётом особенностей конкретной системы МП и переводимых текстов.
Источники и ресурсы по теме
Enjoy!
1. Международный стандарт по предоставлению услуг машинного редактирования ISO 18587:2017.
3. «ПОСТРЕДАКТИРОВАНИЕ В ТРАНСЛАТОЛОГИЧЕСКОЙ ПАРАДИГМЕ», Ю. И. Чакырова.
4. «КАК БЫ Я ПРЕПОДАВАЛА ПОСТРЕДАКТИРОВАНИЕ МП В ВУЗЕ», С. Ю. Светова.
5. www.pemt.ru, С. Ю. Светова.
6. Introduction to Post‐Editing: Who, What, How and Where to Next? Dr. Sharon O’Brien, Centre for Next Generation Localisation Dublin City University.
7. «ПОСТРЕДАКТИРОВАНИЕ МАШИННОГО ПЕРЕВОДА КАК АКТУАЛЬНОЕ НАПРАВЛЕНИЕ ПОДГОТОВКИ ПЕРЕВОДЧИКОВ В ВУЗАХ», Н. В. Нечаева, С. Ю. Светова.
8. «Постредактирование машинного перевода: теоретические аспекты», Н. А. Худяков.
9. What counts as useful advice in a university post-editing training context? Report on a case study, Ilse Depraetere.
10. Computers and Translation: A translator's guide, Harold Somers (16 глава).