Всем привет! Сегодня я решила рассказать, откуда берутся дурацкие и нелепые переводы у компьютерных переводчиков. Вдруг кому-то будет интересно? Сначала опишу буквально в двух словах, как устроены многоязычные компьютерные переводчики. Не переживайте, смешное тоже будет, но чуть позже)). Поскольку языки состоят из слов, надо все эти слова каким-то образом хранить в базе данных. В словарях слова хранятся обычно по алфавиту, так их удобнее искать. А в базах данных компьютерных переводчиков они группируются по семантическим признакам, то есть по значениям. Например, есть группа со значением "украсть", и в ней будут собраны все слова на разных языках. Например, для русского тут будут, помимо "украсть", также "кража", "угнать", "угон", "стырить", "подтырить", "скоммуниздить" и т.д. Причём самые "нормальные" слова, приличные и без эмоциональной окраски, расположены в начале списка. Поэтому если вбить в переводчик фразу "он скоммуниздил у меня драндулет", с большой вероятностью получится впо