Найти тему
Минус фунт

517. Онлайн переводчики

Оглавление
Кадр из фильма "Анна Каренина" 1967 год
Кадр из фильма "Анна Каренина" 1967 год

В настоящее время системы машинного перевода достигли относительного совершенства, и временами переведенный компьютером текст неотличим от переведенного знающим язык человеком. Мы, чисто из любопытства, провели небольшое исследование, поручив нескольким конкурирующим сервисам онлайн-перевода перевести один и тот же текст, и сравнить результаты.

Насколько замысел удался, судить вам. В любом случае, серьезно относиться к результатам "исследования" не стоит.

-2

Читаем Толстого

Итак, вот исходный текст, первые 3 абзаца романа Л.Н. Толстого "Анна Каренина".

Все счастливые семьи похожи друг на друга, каждая несчастливая семья несчастлива по-своему.

Все смешалось в доме Облонских. Жена узнала, что муж был в связи с бывшею в их доме француженкою-гувернанткой, и объявила мужу, что не может жить с ним в одном доме. Положение это продолжалось уже третий день и мучительно чувствовалось и самими супругами, и всеми членами семьи, и домочадцами. Все члены семьи и домочадцы чувствовали, что нет смысла в их сожительстве и что на каждом постоялом дворе случайно сошедшиеся люди более связаны между собой, чем они, члены семьи и домочадцы Облонских. Жена не выходила из своих комнат, мужа третий день не было дома. Дети бегали по всему дому, как потерянные; англичанка поссорилась с экономкой и написала записку приятельнице, прося приискать ей новое место; повар ушел вчера со двора, во время самого обеда; черная кухарка и кучер просили расчета.

На третий день после ссоры князь Степан Аркадьич Облонский – Стива, как его звали в свете, – в обычный час, то есть в восемь часов утра, проснулся не в спальне жены, а в своем кабинете, на сафьянном диване. Он повернул свое полное, выхоленное тело на пружинах дивана, как бы желая опять заснуть надолго, с другой стороны крепко обнял подушку и прижался к ней щекой; но вдруг вскочил, сел на диван и открыл глаза.

Переведем текст рядом сервисов на английский язык, а затем переведем результат перевода вновь на русский язык, тем же самым сервисом.

Доступные бесплатные сервисы

Сервисы использованы следующие:

DeepL Translate https://www.deepl.com/translator

Google Переводчик https://translate.google.ru

Яндекс Переводчик https://translate.yandex.ru

Promt.One https://www.translate.ru/перевод

Bing Переводчик Майкрософт https://www.bing.com/translator

Reverso https://www.reverso.net/перевод-текста

Переводчик больших текстов https://www.m-translate.ru/translator/text?

Translatedict https://www.translatedict.com

Collins Dictionary Translator https://www.collinsdictionary.com/translator

А теперь проверим уникальность исходного текста онлайн-сервисом проверки на плагиат https://advego.com/antiplagiat/.

Сервис Адвего для выявления плагиата

Ниже скрин-шот проверки исходного текста.

-3

Ниже результат проверки обратного перевода с английского сервисом DeepL Translate.

-4

Совпадений 42% по шинглам и 85% на рерайт. По-прежнему приведены 5 источников плагиата, берем только первый найденный источник с наибольшим совладением (в сети встречаются и частично искаженные тексты, как и литературоведческие исследования с обширными цитатами). Совпадения - это дополнение уникальности до 100%, и наоборот. Желтым цветом выделены совпадения по шинглам, голубым то, что сервис счел рерайтом.

Сравнение сервисов

Ниже в таблице проценты совпадений и ранги (порядок первенства по качеству) отдельно по шинглам, словам и средний ранг. Порядок переводчиков приведен по окончательному порядку среднего ранга. Лучшим переводчиком считаем тот, который выше - максимальное количество слов верно восстановлены после двойного перевода, а также максимальное количество фраз.

-5

Пока так. Только одно сомнение возникает. В качестве языка прямого и обратного перевода мы использовали английский язык, достаточно своеобразный, где при двойном переводе может потеряться род (кухарка превратиться в повара и пр.), и где жестко задан порядок слов, в отличие от свободного в русском языке.

Давайте повторим все еще раз, с использованием в качестве посредника немецкого языка, грамматически более близкого к русскому, ввиду наличия родов, падежей и более свободного порядка слов.

-6

Изменился порядок сервисов, но главное то, что по всем сервисам процент совпадений гораздо ниже. Чего не должно было быть, если бы переводчик создавался как прямой переводчик с русского на немецкий и обратно. А теперь давайте считать.

При числе языков 100 перевод с любого языка на английский и обратно требует наличия 99 пар программ, или всего 198 программ. Перевод с любого языка на любой требует создания 100*99=9.900 программ. Оттого при создании большинства многоязычных сервисов за основу берется один язык (как правило, английский), и при переводе с русского на немецкий последовательно осуществляется перевод с русского на английский, а затем с английского на немецкий. Тем самым все ошибки первого перевода переносятся во второй, плюс свои специфичные, что понижает процент совпадений. Испорченный телефон.

Выводы

Так каковы же выводы, на достаточно ограниченном и не претендующем на полноту материале? По обоим таблицам на 1-2 местах сервис Translatedict. Неплохое положение занимают Google Переводчик и Яндекс Переводчик. Абсолютный аутсайдер Reverso.

Не будем вдаваться в тонкости работы алгоритмов, каким образом в одном из вариантов перевода черная кухарка (словарное значение: прислуга, готовящая пищу для дворовых людей, для прислуги) превратилась в чернокожего повара, а ставшая мемом фраза "Все смешалось в доме Облонских" во всем понятное "В Облонском доме бардак".

В заключение вариант двойного перевода через английский язык сервисом Translatedict, который согласно принятым нами правилам оценки должен быть признан лучшим:

Все счастливые семьи одинаковы; каждая несчастливая семья несчастлива по-своему.

Все смешалось в доме Облонских. Жена узнала, что ее муж находится в связи с французской гувернанткой, находившейся в их доме, и объявила мужу, что не может жить с ним в одном доме. Такое положение продолжалось третий день и болезненно переживалось и самими супругами, и всеми членами семьи, и домочадцами. Все члены семьи и домочадцы чувствовали, что нет никакого смысла в их совместном проживании и что на каждом постоялом дворе люди, случавшиеся встречаться, более связаны друг с другом, чем они, члены семьи Облонских и домочадцы. Жена не выходила из своих комнат, мужа не было дома третий день. Дети бегали по всему дому, как потерянные; англичанка поссорилась с экономкой и написала записку подруге, прося ее найти для нее новое место; кухарка ушла со двора вчера, во время самого обеда; черный повар и кучер попросили расчет.

На третий день после ссоры князь Степан Аркадьевич Облонский — Стива, как его звали в миру, — в обычный час, то есть в восемь часов утра, проснулся не в спальне жены, а в свой кабинет, на сафьяновом диване. Он повернулся своим полным, холеным телом на диванных пружинах, как бы желая снова заснуть надолго, с другой стороны крепко обнял подушку и прижался к ней щекой; но вдруг вскочил, сел на диван и открыл глаза.

Наихудшим же следует признать перевод сервисом Reverso через немецкий язык.

Все счастливые семьи одинаковы, каждая несчастная семья несчастна по-своему.

В Облонском доме бардак. Женщина узнала, что у мужа был роман с французской гувернанткой в её доме, и сказала мужу, что она не может жить с ним в том же доме. Это был третий день, когда эта ситуация с болью испытали на себе сами супруги, все члены семьи и домашнее хозяйство. Все члены семьи и семьи чувствовали, что нет смысла в их сосуществовании и что в каждой гостинице случайные люди были более связаны, чем они, члены семьи и члены семьи Облонского. Женщина не выходила из комнаты, мужчины не было дома на третий день. Дети бежали по дому, как заблудшие; англичанка поссорилась с экономкой и написала записку подруге, которая попросила ее найти новое место; повар покинул двор вчера в полдень; черный повар и кучер попросили плату.

На третий день после спора князь Степан Аркадьич Облонский - Стив, как его называли в мире, - проснулся в обычный час, то есть в восемь часов утра, не в спальне жены, а в своем кабинете, на диване Сафьянны. Он развернул свое полное, высохшее тело на перья дивана, как будто снова заснул на долгое время, с другой стороны, крепко обнял подушку и прижал к ней щеку; но вдруг вскочил, сел на диван и открыл глаза.

-7