Найти в Дзене
Хочу спокойной жизни

Смешные моменты с компьютерными переводчиками

Всем привет! Сегодня я решила рассказать, откуда берутся дурацкие и нелепые переводы у компьютерных переводчиков. Вдруг кому-то будет интересно?

Сначала опишу буквально в двух словах, как устроены многоязычные компьютерные переводчики. Не переживайте, смешное тоже будет, но чуть позже)).

Поскольку языки состоят из слов, надо все эти слова каким-то образом хранить в базе данных. В словарях слова хранятся обычно по алфавиту, так их удобнее искать. А в базах данных компьютерных переводчиков они группируются по семантическим признакам, то есть по значениям. Например, есть группа со значением "украсть", и в ней будут собраны все слова на разных языках. Например, для русского тут будут, помимо "украсть", также "кража", "угнать", "угон", "стырить", "подтырить", "скоммуниздить" и т.д. Причём самые "нормальные" слова, приличные и без эмоциональной окраски, расположены в начале списка. Поэтому если вбить в переводчик фразу "он скоммуниздил у меня драндулет", с большой вероятностью получится вполне нейтральный перевод "он украл у меня машину".

С одной стороны, принцип вполне логичный... А с другой, при таком подходе не избежать казусов в переводе.

Например, возьмём одну из самых известных фраз русского языка "Иди в ж@пу". Естественно, слово "ж@па" идёт где-то в самом конце списка и к тому же помечено, что оно не литературное и в приличном обществе его не употребляют. Поэтому для перевода программа выберет самое нейтральное слово, и мы получим на выходе что-то типа "Пройдите, пожалуйста, в ягодицы".

Это, конечно, очень смешно, но неправильно. И вот сидит один несчастный (или, наоборот, счастливый?🤔) айтишник и помечает слова, куда может пойти человек. "Ж@па"? Отлично, годится. "П@па"? С натяжкой, конечно, сойдёт, но явно хуже, чем "ж@па". "Куй"? Классика жанра, да. "Член"? "Пипетка"? Ну вот нет же... И т.д.

И ещё проблема в том, что он фиг кому объяснит, в чём заключается его работа, а если попытается, то не поверят и покрутят пальцем у виска🤣.

Это давно было. Сейчас переводчики уже правильно переводят такие вещи. Но не всегда.😏

#лингвистика #компьютерный переводчик #юмор #приколы #смешная работа

Вообще не придумала, какую картинку воткнуть, поэтому пусть будет эта для заставки
Вообще не придумала, какую картинку воткнуть, поэтому пусть будет эта для заставки