Найти в Дзене
The Translator

PEMT: что нужно знать уже сегодня, чтобы безболезненно адаптироваться к изменениям и укрепить позиции на переводческом рынке?

Оглавление

Профессия постредактора машинного перевода набирает все большую популярность. На фоне противоречивых мнений общественности о явлении машинного перевода как такового прогнозы руководителей переводческих компаний на ближайшие несколько лет выглядят вполне однозначно: современному специалисту в области перевода будет не обойтись без навыков постредактирования МП.

Информации по теме в русскоязычном интернете не так много, как хотелось бы, ее приходится собирать по крупицам. У исполнителей и заказчиков могут быть разные ожидания от процесса и результата. Данная статья представляет собой своеобразный гид в мире постредактирования, помогает получить базовые знания для входа в профессию и упорядочить их.

Вводная информация

PEMT (postediting machine translation) или постредактура машинного перевода представляет собой процесс переработки машинного перевода и его доведения до ожидаемого уровня качества.

Можно догадаться, что ожидаемый уровень качества — это такое обтекаемое понятие. При описании процесса постредактирования в основном используются как раз такие формулировки. Причина, как было сказано выше, кроется в отсутствии универсальных требований, применимых к каждому конечному продукту.

Тем не менее, специалисты выделяют набор руководящих принципов постредактирования. Постредактирование выполняется а) с помощью минимальных усилий, б) за минимальное возможное количество времени, в) с целью получения максимального результата. Следующая схема демонстрирует эту зависимость.

Условия осуществления постредактирования: максимальный результат при минимальных времени и усилиях
Условия осуществления постредактирования: максимальный результат при минимальных времени и усилиях

Регламентирующие документы

Хорошие новости: профстандарт существует. Международный стандарт по предоставлению услуг машинного редактирования ISO 18587:2017 (Translation Services – Post-editing of machine translation output – Requirements. International Organization for Standardization) описывает возможные уровни качества МП, а также варианты постредактирования.

Кроме того, схожую функцию выполняет руководство по постредактированию машинного перевода Общества пользователей автоматического перевода TAUS (Translation Automation User Society) Machine Translation Post-editing Guidelines.

Уровни качества и варианты редактирования МП

Определимся с уровнями качества перевода (всего их два).

Первый уровень качества, good enough quality («приемлемое» качество), предполагает проработку лексических и грамматических ошибок, а также проверку соответствия терминов их машинному переводу и доперевод непереведенных слов при их наличии.

Согласно TAUS, для достижения «приемлемого» уровня качества постредактор должен убедиться, что:

· перевод является корректным с точки зрения семантики;

· в переводе нет случайных добавлений или опущений;

· перевод не содержит оскорбительного или неприемлемого с точки зрения культуры контента;

· результат МП используется по максимуму;

· соблюдены основные правила орфографии;

· текст редактируется только когда это нужно для понимания, избегаются субъективные коррекции стилистических ошибок;

· максимально сохраняется порядок слов, предложения не меняются местами (допускается наличие неестественно звучащих предложений).

Второй уровень качества, publishable quality/quality similar or equal to human translation (качество, отвечающее предъявляемым к публикации требованиям/соответствующее традиционному переводу) предполагает проработку текста практически на всех лингвистических уровнях: грамматическом, лексическом, синтаксическом и стилистическом.

Согласно TAUS, для достижения такого уровня качества постредактор должен убедиться, что:

· перевод является корректным с точки зрения грамматики, синтаксиса и семантики;

· термины переведены правильно (а также соблюдено единообразие терминологии — прим. автора);

· в переводе нет случайных добавлений или опущений;

· перевод не содержит оскорбительного или неприемлемого с точки зрения культуры контента;

· результат МП используется по максимуму;

· соблюдены основные правила орфографии, пунктуации и переносов;

· форматирование текста является корректным.

Варианты постредактирования коррелируются с уровнями качества (их также два): light post-editing (легкое постредактирование) и full post-editing (полное постредактирование).

Выдержка из международного стандарта по предоставлению услуг машинного редактирования ISO 18587:2017
Выдержка из международного стандарта по предоставлению услуг машинного редактирования ISO 18587:2017

Специалисты PROMT даже различают стратегии постредактирования МП по объему постредактирования в процентах (~100, 80, 60, 35, 20, где 100% соответствует полному редактированию, 80% — МП используется в качестве подсказки по терминологии, 60% — МП используется в качестве грамматического подстрочника, 35% — анализ сомнительных мест с обращением к исходному тексту, 20% — корректура или исправление очевидных погрешностей без обращения к исходному тексту).

Немного цифр

С постредактированием скорость перевода может возрасти в 2,5 раза по сравнению с традиционным переводом. Экономия времени на перевод составляет в среднем 50%.

Специалисты MemSource приводят такой пример: при скорости перевода 2 000 слов в день скорость постредактирования составляет 4 000 слов в день и достигает до 8 000 слов в день при владении навыками эффективного постредактирования.

MT Workshop Series: Efficient MTPE Training Session 1
MT Workshop Series: Efficient MTPE Training Session 1

Важно понимать, что эти значения могут меняться в зависимости от объема, предназначенности текста, требований к качеству, ожиданий заказчика, времени и проч.

По моим личным ощущениям, МП стоит использовать как основу для постредактирования тогда, когда объем постредактирования составляет до 40%. В остальных случаях МП можно использовать как подстрочник для справки.

Актуальное руководство постредактора машинного перевода

Специалисты MemSource выделяют следующие распространенные ошибки пост-редакторов:

· субъективные стилистические исправления;

· недостаточно отредактированные переводы;

· избыточно отредактированные переводы;

· неверное употребление терминов, несоблюдение единообразия терминологии;

· наличие непереведенных слов, добавлений и опущений;

· неверная передача аббревиатур;

· наличие нелокализованного текста;

· опечатки;

· буквальный перевод или «ложные друзья переводчика»;

· ошибки на уровне структуры;

· наличие машинных неологизмов (несуществующих слов).

Я бы добавила в этот список пункты «грамматические ошибки (согласование по лицам, числам и падежам)», «очевидные логические ошибки», «несоблюдение единообразия употребления единиц измерения и повторяющихся конструкций», «неверная транслитерация или буквальный перевод имен собственных», «нарушение типографических норм для специальных символов (тип кавычек, тире и проч.)» — прим. автора.

…а также дают следующие рекомендации по проработке таких ошибок:

· исправляется любой термин, неверно употребленный в тексте (технический или нетехнический), исключается несоблюдение единообразия терминологии;

· исправляется любая синтаксическая ошибка (нарушение правил употребления частей речи, разрушение структуры фразы, неправильный порядок слов и фраз);

· исправляется любая морфологическая ошибка неверные формы слов (число, род, падеж, лицо, время, наклонение, залог и проч.);

· исключаются любые опущения (абзаца, предложения, фразы, слова), которые мешают восприятию смысла исходного сообщения;

· исправляются любые опечатки;

· исправляются ошибки пунктуации, которые мешают восприятию смысла исходного сообщения;

· допускается наличие стилистических ошибок, которые не мешают восприятию смысла исходного сообщения;

· не допускается наличие оскорбительного или неприемлемого с точки зрения культуры контента.

На основе этих данных можно составить техническое задание для каждой отдельной языковой пары с учётом особенностей конкретной системы МП и переводимых текстов.

Источники и ресурсы по теме

Enjoy!

1. Международный стандарт по предоставлению услуг машинного редактирования ISO 18587:2017.

2. Руководство по постредактированию машинного перевода Общества пользователей автоматического перевода TAUS.

3. «ПОСТРЕДАКТИРОВАНИЕ В ТРАНСЛАТОЛОГИЧЕСКОЙ ПАРАДИГМЕ», Ю. И. Чакырова.

4. «КАК БЫ Я ПРЕПОДАВАЛА ПОСТРЕДАКТИРОВАНИЕ МП В ВУЗЕ», С. Ю. Светова.

5. www.pemt.ru, С. Ю. Светова.

6. Introduction to Post‐Editing: Who, What, How and Where to Next? Dr. Sharon O’Brien, Centre for Next Generation Localisation Dublin City University.

7. «ПОСТРЕДАКТИРОВАНИЕ МАШИННОГО ПЕРЕВОДА КАК АКТУАЛЬНОЕ НАПРАВЛЕНИЕ ПОДГОТОВКИ ПЕРЕВОДЧИКОВ В ВУЗАХ», Н. В. Нечаева, С. Ю. Светова.

8. «Постредактирование машинного перевода: теоретические аспекты», Н. А. Худяков.

9. What counts as useful advice in a university post-editing training context? Report on a case study, Ilse Depraetere.

10. Computers and Translation: A translator's guide, Harold Somers (16 глава).

11. MEMSOURCE Efficient MTPE Training.