Эх, были времена, когда машинный перевод был прямо жутким. Мой любимый пример из времён, когда я только-только начинал серьёзно учить английский язык - это перевод имени Bilbo Baggins как "Бильбо Ножные Кандалы", а названия книги The Lord of the Rings - "Бог из одних только колец". Сейчас, наверно, даже в самых маленьких системах перевода такого не встретить - времена меняются, и технологии шагают вперёд.
Но я-то практически тестировщик по основной профессии, так что давайте зададим этим киборгам с их нейросетями что-то более сложное, и посмотрим - как хорошо они справятся. Ну и выберем лучшего. Тестируемую фразу придумаем вот такую:
Просю в энный раз - дайте и мну че-нить пожратушки! Вампирище без кровятинки загибается просто!
Что тут сложного? Ну, не для нашего литературного изысканного чувства вкуса (простите, товарищи эстеты, если кого-то довёл до обморока), а для машины? Во-первых, намеренно искажённые слова - "просю", "мну" и "че-нить". Во-вторых, использование нехарактерных суффиксов - "пожратушки", "вампирище", "кровятинка". В-третьих, использование слова "загибаться" в значении "плохо себя чувствовать" и связанное с ним слово "просто", которое может быть представлено целой кучей разных вариантов. В-четвёртых, устойчивая и довольно нехарактерная фраза - "в энный раз". Ну и в-пятых - отсутствующий контекст (точнее, представленный только союзом "и"), который подразумевает, что кому-то дают еду, а автору фразы, вампиру, не дают. Обозначим сложные места цифрами и будем начислять по баллу за каждый правильный вариант:
Текста будет много, но для тех, кого интересуют такие тонкости - будет интересно. В общем, охладите трахание, чашка риса кошка жена скидка десять процент - и поехали.
Google-переводчик:
I ask for the umpteenth time - give me a che-thread to eat! Vampirishe without krovyatinki bent simply!
1, 2, 3, 6 - правильно.
4 - контекст не разгадан.
5 - совсем мимо, алгоритм принял "че-нить" за два слова - загадочное che и "нить" в смысле "нитка" - thread.
7, 8 - не опознал наши родимые суффиксушечки и решил не рисковать, а просто транслитерировать (и почему в слове "вампирище" вместо буквы "щ" - "ш"?).
9, 10 - соответственно, тоже не угадал значение и использовал самый стандартный вариант - глагол to bend - "изгибаться, склоняться, гнуться".
Итого: 4 балла.
Яндекс-переводчик:
I ask for the umpteenth time - give me and I'll take the thread of the devourer! Vampirishche without blood bends simply!
1, 2, 4, 6, 8 - да (в отличие от Гугла смог угадать слово "кровятинка", и зацените, насколько у Яндекса богаче поиск по оттенкам именно русских слов - пожратушки это не просто to eat, а целое to devourer).
3 - увидел, но не смог правильно интерпретировать. Вместо "дайте и мне" перевёл как "дайте мне и..."
5 - тоже запутался в нитях.
7 - Вампирище не смог угадать, но хотя бы передал звук "щ".
9, 10 - те же самые ошибки, что и у Гугла.
Итого: 4-5 баллов (желание угадать контекст с "мну чё-нить пожратушки", конечно, похвально, но в отличие от Гугла он привело к тому, что смысл фразы полностью изменился).
Promt:
I ask for an enny time - give and honey che-thread of the town hall! Vampire without bloodthirsty bends simply!
1, 7 - да. Первый, кто смог разгадать слово "Вампирище", но зато всё остальное... Уф.
2 - не знает, что такое "энный раз", транслитерировал.
3 - увидел союз "и", но не смог понять контекст.
4 - посчитал, что "мну" - это опечатка слова "мёд", honey.
5 - стандартные нитки.
6 - посчитал, что "пожратушки" это опечатка слова "ратуша", town hall.
8 - "кровятинку" распознал как "кровожадность", bloothirsty.
9, 10 - стандартная ошибка.
Итог: 2 балла.
Reverso:
For the last time, give me a little something to eat! A vampire with no blood on it just bends!
1, 4, 6, 10 - да, хотя just тут просто угадано, но да ладно.
2 - ошибся со значением и вместо "в который раз" подставил "в последний раз".
3 - не увидел контекст.
5 - коряво, но всё-таки разгадал слово "че-нить", браво.
7 - угадал вампира, но зря использовал неопределённый артикль - мы ведь прекрасно знаем, о каком именно вампире идёт речь - о том, кто произносит эти слова.
8 - опять-таки, угадал, хоть и очень коряво - получилось не "вампир без крови", а "вампир с обескровливанием".
9 - похоже, слово "загибаться" в этом задании самое сложное, Промт тоже с ним не справился.
Итог: примерно 4-5 баллов (разброс в связи с корявостями перевода).
Microsoft Bing:
I ask for the umpteenth time - give me a f**k! A vampire without blood bends simply!
1, 2, 4, 7, 8 - да (вампир, правда, опять с артиклем, ну да ладно).
3, 5, 6 - я, честно, понятия не имею, как можно перевести "и мне че-нить пожратушки" как give me a f**k. Правда, это какая-то мистика.
9, 10 - и этот не угадал.
Итог: 4-5 баллов (ну уж слишком искажён смысл фразы, чтобы оставить это совсем без какого-то штрафа).
Deepl:
For the umpteenth time, give me something to eat too! Vampire's just dying without blood!
Ну ладно, признайтесь, вы ждали эту программу и знали, что именно она победит. А если не знали, то только потому что с ней не знакомы. Но давайте посмотрим по порядку, хотя бы для приличия.
1 - убрал I ask, и правильно сделал - в разговорной речи вполне допустимо сократить эту часть (примерно как в русском языке мы же не скажем "Я говорю тебе - смотри сюда", а сокращаем: "Говорю тебе - смотри сюда").
2 - стандартная фраза со значением "в который раз", плюс балл.
3 - единственный, кто разглядел контекст и перевёл "дайте и мне" как "give me too", балл без вопросов.
4, 5, 6, 8 - правильно угадал все слова.
7 - угадал вампира. Единственный нюанс - что в данном случае вполне можно было бы использовать определённый артикль - the vampire - но это стилистическая мелочь, а не серьёзная ошибка.
9 - распознал значение слова и перевёл его аналогичным фразеологизмом на английском.
10 - и использовал слово "просто" в правильном значении.
Итог: 10 баллов.
Резюмируя - Deepl не зря называют самым точным переводчиком. Он оставил всех конкурентов далеко позади. Что касается других - то, в принципе, все они находятся на примерно одинаковом уровне, со своими плюсами и минусами, которые в какие-то определённые моменты могут испортить перевод, а в какие-то - наоборот, помочь разобраться с трудным моментом. Например, "Промт" - он явно сделан с расчётом на распознавание сканированного текста и способен работать с большим количеством опечаток и ошибок распознавания, и наверняка будет лучшим решением именно для этой работы. Но вот в вопросах перевода сложного текста именно эта его фишка делает перевод совершенно ошибочным. И в моём тесте он набрал так мало баллов просто потому что я использовал его не по назначению.
Что касается двух самых популярных переводчиков - Яндекса и Гугла, то они примерно одинаковы. Яндекс обладает чуть большим корпусом русскоязычных текстов, и в некоторых случаях способен более удачно подобрать какие-то синонимы или распознать какие-то местячковые слова, но зато Гугл владеет более сильным аналитическим алгоритмом и, даже если не способен понять какие-то отдельные слова, гораздо реже "портит" непонятную фразу, обычно просто оставляя непонятное слово непереведённым. В общем, поговорка про то, что Гугл точнее, а Яндекс человечнее для их систем онлайн-перевода тоже работает.
Ну а самое главное - не стоит забывать, что любой онлайн-переводчик это просто инструмент, который стоит использовать в тех областях, для которых он предназначен (в качестве подсказки или для общего понимания текста), и не стоит во всех остальных (например, для перевода литературных текстов).
#русский язык #английский язык #переводы