Подписывайтесь на канал «Другая фаза», чтобы быть в курсе самых горячих тем.
Мы уже привыкли к тому, что ежедневно прибегаем в автоматическому переводу. Это очень удобно тем, кто вообще не знает языка или владеет не слишком уверенно и потому читает в оригинале слишком медленно. Роботы переводят нам отдельные тексты, страницы сайтов, посты в соцсетях.
И всё бы хорошо, вот только среди пользователей давно ходят легенды о перлах, которые то и дело выдают машинные переводчики. Самые яркие из них давно стали популярными мемами и зажили собственной жизнью в сети. И коллекция постоянно растёт. Насколько можно доверять качеству автоматизированного перевода и от чего зависит частота ошибок?
Роман Душкин, директор по науке и технологиям Агентства Искусственного Интеллекта объясняет, как обстоят дела.
Спасибо Владимиру Владимировичу
Эксперт приводит анекдотический пример, когда Google переводил фразу «Thank you Mr. President» как «Спасибо, Владимир Владимирович». Ещё недавно так и было, сейчас оплошность уже исправили. Это забавная ситуация, но хотелось бы всерьёз обсудить, почему возникают подобные ошибки.
Роман поясняет: скорее всего, это связано с устройством переводчика, который постоянно обучается у пользователей. Там есть функция: перевести текст, затем исправить перевод и отправить в Google, предложив использовать этот вариант, как более правильный.
Конечно, Google не верит каждому такому запросу. Там есть система двухфазной валидации. Во-первых, новый вариант перевода должны предложить одновременно несколько разных пользователей. Во-вторых, его перепроверяет экспертное сообщество. Скорее всего, случай с переводом «мистера президента» произошла по вине экспертного сообщества, которое по каким-то причинам одобрило именно этот вариант.
Основа работы автоматических переводчиков — машинное обучение
Работа переводчика базируется на изучении примеров из интернета. Основа работы таких программ — машинное обучение. Это сбор закономерностей и статистики, какие закономерности чаще всего встречаются. Если снова привести пример с переводом «мистера президента», то здесь взяли неправильную выборку, сопоставили неправильные пары «оригинал - перевод». И это в полной мере ошибка Google.
Люди не могут вручную обрабатывать огромное количество информации из сети. Так что составление выборки переводчика автоматизировано. Это уже искусственный интеллект второго порядка, построенный не на машинном обучении. Он подбирает документы и потом загружает в нейросеть, которая лежит в основе Google-переводчика. Вероятно, на этапе подбора и произошёл сбой.
Собственно, вывод из всего этого: ни один автоматический переводчик пока не способен работать сам по себе, без участия людей. Программа может делать предварительный перевод, но затем полученный текст обязательно должен вычитать, проверить на наличие ошибок и отредактировать человек. Обработка естественного языка — задача, которая пока решена далеко не на 100%.
Полностью видео с комментариями Романа Душкина смотрите на канале Youtube.
А вы уже применяете технологии ИИ в бизнесе или аналитике? Эксперты Агентства Искусственного Интеллекта проконсультируют по всем вопросам и разработают индивидуальные программы искусственного интеллекта для любой сферы вашей деятельности.
Мы всегда в курсе самых значимых событий в мире науки и информационных технологий. Подписывайтесь и следите за новостями на канале «Другая Фаза».
Если хотите всегда первыми быть в курсе новостей в мире искусственного интеллекта и узнать больше о работе нашего агентства, подписывайтесь на наш инстаграм.
Спасибо, что дочитали! Не забывайте, пожалуйста, оценить запись лайком. Это вдохновляет нас на новые уникальные материалы для вас. До новых встреч!