Искусственный интеллект прочно вошёл в нашу жизнь. Он помогает решать совершенно разные задачи — от бытовых до рабочих или повседневных. Например, чтобы перевести текст поста в социальной сети или статью на иностранном сайте, достаточно воспользоваться Google-переводчиком. Да, не идеально, но можно понять, о чем речь. А ведь ещё десять лет назад для этого понадобилось бы обратиться к переводчику или переводить текст самостоятельно со словарём.
В этой статье мы расскажем о машинном переводе, предпосылках его зарождения, этапах развития. Сегодня у нас небольшой, но очень увлекательный экскурс в историю.
Ужасная статья? Ставь 1 в комментариях. Если норм, то 5.
Убрать языковые барьеры
Чтобы вы без труда могли перевести текст любимой песни, десятки лет математики, инженеры и лингвисты работали, не покладая рук.
Эпоха великий открытий позволила стереть сухопутные и морские границы, однако остались языковые барьеры между людьми. В XVII веке учёные видели два способа решить эту проблему:
- Создать единый язык, которым владели бы все жители планеты.
- Создать технологию, позволяющую понимать иностранный язык любому жителю планеты.
На Youtube-канале iTrex еще больше интересного и полезного контента о переводах, языках и международном бизнесе. Заходите и жмите на колокольчик! 🔔
Поначалу гениальные умы ухватились именно за первую идею. Среди них были такие люди, как Рене Декарт и Готфрид Лейбниц. Математики считали все языки мира внутренне нелогичными.
Варшавский лингвист и окулист Лазарь Маркович Заменгоф после 10 лет кропотливой работы создал искусственный язык “эсперанто” — произошло это в 1887 году. На эсперанто до сих пор публикуются книги (в России, Чехии, Италии, США, Бельгии) и вещают радиостанции (в Китае, Австралии, Бразилии и Польше), а в Венгрии этот язык даже преподают в некоторых школах.
Первые шаги на пути к инновациям
Можно сказать, что первые шаги делали практически наши соотечественники. Французский изобретатель Жорж Арцруни был выходцем из Российской империи. Он создал первый машинный переводчик. На этом устройстве помимо перевода можно было составить телефонный справочник или зашифровать и дешифровать сообщение.
Следом за Арцруни Петр Троянский из СССР представил научной общественности собственную систему машинного перевода. Особенностью системы было то, что привести в читабельный вид полученный набор символов мог только редактор. Без человека это устройство просто не работало. Впрочем, и в 21 веке машинный переводчик не выдаст идеально грамотный перевод без участия живого редактора.
Принцип работы устройства был очень сложным. Оператор должен был брать каждое слово из текста и делать его фотографию, а на печатной машинке вводить всю морфологическую информацию о данной лексической единице (число, падеж и др.). Так как СССР в те времена был закрыт, об изобретении советского инженера узнали лишь в середине XX века после Второй Мировой Войны. Системой Троянского воспользовались позднее, создавая клавиатуру для компьютера.
В 40-х годах XX века американский ученый Уоррен Уивер сформулировал идею машинного перевода, принцип которого заключался в декодировании. Работало это следующим образом:
- Был создан язык-посредник Interlingva — что-то вроде упрощенного варианта английского языка.
- Предложение или целый текст переводился на него.
- С языка-посредника делался перевод на требуемый язык.
На заре новой эры
Начало новой эры положила компания IBM, проведя в середине 50-х годов прошлого века Джорджтаунский эксперимент. Компьютерный переводчик, созданный специалистами корпорации и запущенный на компьютере 701 модели, смог справиться с 60 предложениями на русском языке. Происходило это следующим образом. Оператор вводил текст на перфокартах, а машина выдавала перевод транслитом. Особенно значим был тот факт, что тексты касались не только общих тем, но и, к примеру, темы органической химии. Машинный переводчик был очень быстрым по тем временам — он переводил две с половиной строчки перевода в секунду.
Общество ликовало: газеты пестрили сенсациями, а частные компании и американские власти готовы были инвестировать в инновацию. Корпорация IBM приступила к разработке новой программы, однако последующие варианты были слишком сложными и дорогими. В итоге эксперты того времени пришли к выводу, что данная технология бесперспективна. Все дальнейшие попытки развития машинного перевода были приостановлена на неопределенное время.
Однако энтузиасты всё же оставались. Одним из них был Питер Тома, глава и собственник компании «Systran». Не обращая внимание на царившее в то время скептическое отношение к новым технологиям в области машинного перевода, он продолжил заниматься развитие наработок. Первые созданные им системы работали на основе лингвистической информации, существенно ускоряя перевод текстов.
А пока…
Советские деятели науки тоже занимались машинным переводом. В 50-х годах две группы учёных под руководством математиков Дмитрия Панова и Алексея Ляпунова конкурировали между собой. Последний, кстати, был основателем советской кибернетики.
Им хватило всего года, чтобы изучить американский опыт и создать собственные наработки. Опыты проводили на отечественном компьютере БЭСМ. Спустя некоторое время под руководством Панова вышел переводчик со словарным запасом более 2000 слов. Конкурирующая группа Ляпунова почти не отставала и дышала в спину.
Подключились к работе и языковеды. На кафедре перевода МГПИ было создано первое неформальное общество машинного перевода. В нашей стране в отличие США энтузиазма по поводу машинного перевода было гораздо больше. Так, в конце 50-х была даже проведена всесоюзная конференция с участием нескольких сотен специалистов.
В это же время в Ленинграде начала функционировать Научно-исследовательская лаборатория инженерной лингвистики. Её коллектив также занимался разработкой компьютерных переводчиков. А после развала Советского Союза именно эти люди стали основными сотрудниками компании PROMT во главе со Светланой Соколовой
Современные компьютерные переводчики
В начале 90-х вышла первая российская система PROMT, прекрасно справляющаяся с переводом специализированной лексики.
Впоследствии PROMT создавала решения для NASA – сотрудничество с космической отраслью стало для компании долгосрочным. Так, в 2005 году системы PROMT стали использоваться на Международной космической станции.
Важнейшим этапом на пути PROMT, российского лидера в сфере информационных технологий, стал договор с французской компанией из Softissimo.
Эта французская компания работала с крупнейшим немецким издательством словарей Langenscheidt. Совместно с PROMT издательство занялось распространением компьютерных переводчиков с французского на немецкий на территории Германии.
В конце 90-х немецкие власти оценили усилия и заслуги компании и вручили почетную национальную награду.
Это приятное событие совпало с выпуском Magic Gooddy, компьютерного переводчика от PROMT. Главный персонаж гусь Гудди (аналог популярного анимационного героя дятла Вудди) владел двумя языками – русским и английским. Машинный переводчик был задуман для школьников, но стал популярным и среди взрослых пользователей.
Вскоре команда PROMT выпустила онлайн-переводчик Translate.ru.
В те времена машинным переводом стоило пользоваться с большой осторожностью. Точно так же, как и сейчас, если вам нужно перевести важный юридический документ. Лучше доверить это профессиональному бюро переводов.
А тем временем за океаном всё та же компания IBM разрабатывала системы нового поколения, которые лучше работали с идиомами, омонимами и многозначными словами. В 2000-х эти системы научились переводить не отдельные слова, а целые фразы.
Сегодня среди русскоязычных пользователей популярны два онлайн-переводчика – от Google и Яндекс.
В 2016 пришло время нейросетей, которые рассматривают в качестве единицы перевода не слово или фразу, а целое предложение, за счёт чего количество ошибок в переводе значительно уменьшается. Однако заменить профессионала они пока всё равно не могут – им не под силу многозначные лексемы или игра слов.
Машинный перевод стремительно развивается, ведь в мире есть много людей, не знающих иностранного языка, для которых бывает очень важно хотя бы в общих чертах понять, о чём написано в иноязычном тексте. В этом и состоит главная цель развития машинных переводчиков.
Благодаря глобализации границы между странами стремительно стираются. Вместе с этим появляется необходимость в переводе с одного языка на другой. Технологии машинного перевода продолжат своё развитие, а об его перспективах вы узнаете в наших следующих статьях.