Использование онлайн-переводчиков при взаимодействии с беженцами в США было внедрено в начале 2020-х годов. Это связано с несколькими факторами, в том числе с растущим числом иммигрантов, говорящих на языках, отличных от английского, а также с необходимостью сократить расходы на перевод. Бюро переводов ТранЭкспресс помогло с переводом статьи «Lost in AI translation: growing reliance on language apps jeopardizes some asylum applications», опубликованной в The Guardian. Давайте рассмотрим, какие трудности возникли в связи с использованием искусственного интеллекта в такой серьезной сфере, как получение убежища в США.
Приятного чтения!
Переводчики обеспокоены тем, что все чаще иммиграционная служба США полагается на переводы, выполненные искусственным интеллектом. Кажется, власти не понимают в полной мере пределов возможностей таких инструментов.
В 2019 году Карлос бежал из Бразилии вместе с сестрой и двумя племянниками после того, как его сын был убит местной бандой у него на глазах. Прибыв в Америку, мужчину разлучили со своей семьей, поместив его в изолятор временного содержания иммиграционной и таможенной службы США.
Родом из Африки, Карлос говорит по-португальски, но в письменной форме языком не владеет. Персонал временного изолятора в Калексико, штат Калифорния, владел только английским и испанским языками. Сотрудники использовали приложение с возможностью голосового перевода на базе искусственного интеллекта, чтобы понять слова Карлоса, однако система попросту не понимала его акцент или диалект. Именно поэтому Карлос провел шесть месяцев в изоляторе временного содержания иммиграционной и таможенной службы США, не имея возможности ни с кем полноценно общаться.
В то время он не имел четкого представления о том, почему его задержали и где находятся его родные. По словам Карлоса, когда он обращался за медицинской помощью из-за высокого давления или во время ковида, медсестрам было трудно понять его. Испаноговорящие сокамерники помогли заполнить его ходатайство о предоставлении убежища, но инструмент перевода, который они использовали, не позволил составить точный отчет. Приложение не распознало Белу-Оризонти (город, в котором жил Карлос), вместо этого выдав буквальный перевод: «прекрасный горизонт». Отвечая на вопрос о притеснении, в заявлении прописали: «ДА, ГАНГУЭ ДУ БУРАКАО ЗАСТРЕЛИЛ МОЕГО СЫНА, В ПОЛИЦИИ МНЕ ДАЛИ ПОЩЕЧИНУ».
Карлос (имя изменено в целях конфиденциальности) в комментарии для The Guardian заявил, что языковой барьер стал непреодолимой задачей в поисках убежища в Америке и получения вида на жительство. «Никогда не думал, что это будет самым худшим испытанием», — передал он через переводчика.
Иммиграционная служба США заявила, что предоставит мигрантам переводчика-человека по мере необходимости. На самом деле организации по вопросам беженцев отмечают, что многие нуждающиеся не имеют такой возможности. Вместо этого различные агентства, входящие в состав иммиграционной системы США, и некоторые организации по оказанию помощи беженцам все больше полагаются на переводы искусственного интеллекта, используя приложения Google Translate и Microsoft Translator, чтобы преодолеть языковой барьер.
Министерство внутренней безопасности (МВБ) заключило несколько контрактов с фирмами машинного перевода, такими как Lionbridge и TransPerfect Translations International Inc. Сотрудникам иммиграционной службы поступило указание использовать Google Translate для проверки заявлений о предоставлении статуса беженца. Службой таможенной и пограничной охраны (CBP), отвечающей за пограничный контроль, было разработано собственное приложение CBP Translate, облегчающее общение с мигрантами.
«Однако иммиграционная политика США стала чрезмерно зависима от этих инструментов перевода, не осознавая в полной мере их ограничения», — комментирует ситуацию Ариэл Корен, основатель проекта Response Crisis Translation, в составе которого 2500 волонтеров, предоставляющих услуги срочного устного перевода.
«Инструменты перевода с использованием искусственного интеллекта никогда не должны использоваться бесконтрольно или для замены письменных и устных переводчиков. Такие приложения просто нельзя использовать в критических ситуациях — ни на каком языке мира. В особенности это касается языков Третьего мира», — добавил Корен.
«Приложения-переводчики на базе искусственного интеллекта особенно ненадежны для языков, которые значительно отличаются от структуры английского языка или менее задокументированы», — подчеркнул Дамиан Харрис-Эрнандес, исполнительный директор Refugee Translation, еще одной организации, помогающей беженцам.
«Многим организациям и компаниям проще использовать машинный перевод», — сказал Харрис-Эрнандес. «Но неточности перевода могут аннулировать весь процесс [иммиграции]».
По словам некоторых волонтеров Response Crisis Translation, проблемы с приложениями возникают на протяжении всего процесса предоставления убежища: от пограничного контроля до центров временной изоляции и перед иммиграционными судами. Приложение CBP One, обязательное к использованию беженцами перед въездом в страну (по распоряжению администрации Байдена) для записи на прием в Службу таможенного и пограничного контроля США, переведено лишь на несколько языков. И даже в этих переводах появляются ошибки. Например, в версии приложения на гаитянском креольском раздел «Часто задаваемые вопросы» в основном отображается строка сплошных букв, необходимые знаки ударения отсутствуют.
Волонтеры-переводчики из центра Response Crisis говорят, что они сталкивались со случаями отказа в предоставлении убежища из-за того, что приложение передало местоимение «Я» в заявлении беженца как «мы», создавая впечатление, что форма была подана не одним человеком, а несколькими людьми. Также они вспомнили про случай беженки, которая просила убежища из-за домашнего насилия — в своем заявлении она назвала обидчика "mi jefe". Женщина использовала это словосочетание в разговорной речи, ссылаясь на своего отца, однако служба перевода перевела его буквально как «мой босс». Ее ходатайство о предоставлении убежища было отклонено.
«Мало того, что заявления о предоставлении убежища должны быть переведены, правительство часто использует "языковые лазейки", чтобы оправдать депортацию», — сказал Корен, работавший ранее в команде Google Translate. «Приложение должно работать идеально».
Волонтеры сообщают, что затруднения с переводом были особенно критичными в случае афганских беженцев. Основные системы машинного перевода, такие как Google Translate, не предлагают переводы на дари, один из двух официальных языков Афганистана.
«Афганские языки не обеспечены достаточно с точки зрения технологий, в частности местные диалекты», — сказала Ума Мирхаил, руководитель группы из 40 человек, представляющих афганские языки. «Машине практически невозможно перевести сообщение, которое с легкостью передаст профессиональный переводчик, осведомленный о стране происхождения говорящего, включая культурный контекст».
Google Translate доступен на 133 языках, и система «тщательно» обучена «для обеспечения соответствия каждого языка, который мы поддерживаем, высоким стандартам», — заявила представитель Google Чарити Менде, но без достаточных данных может быть сложно разработать масштабный перевод и распознавание речи, сказала она.
Министерство внутренней безопасности США, в состав которого входят Службы таможенного и пограничного контроля, а также иммиграционного и таможенного контроля, проигнорировало неоднократные запросы с просьбой дать комментарии.
Сбои машинного перевода, с которыми столкнулись волонтеры, и неспособность искусственного интеллекта переводить языки мира являются системной проблемой, утверждают Пола Хелм, доцент кафедры науки о данных и этики Амстердамского университета, и Габор Белла, доцент кафедры информационной инженерии и управления в Университете Тренто.
Системы искусственного интеллекта зависят от данных, которые они получают. Качество этих обучающих данных определяется как их точностью, так и полнотой.
По словам исследователей, подобно другим инструментам искусственного интеллекта, сервисы машинного перевода отражают и закрепляют уже существующие предубеждения в обществе, а также энергетические и экономические неравновесия мира. Колониальные амбиции Британской Империи в XVIII веке вывели английский язык на уровень самых изучаемых языков на сегодняшний день. Таким образом, недостатка в англоязычных данных для ввода в системы искусственного интеллекта не существует, однако если дело касается таких языков, как, скажем, суахили — начинаются проблемы. На суахили говорят более 80 миллионов человек по всей Африке, но электронных материалов, по мнению исследователей, гораздо меньше. На самом деле, страниц Википедии на суахили примерно столько же, сколько на бретонском (язык, на котором говорят чуть более 200 000 человек в небольшом регионе Франции).
Кроме того, по их словам, существуют культурные нюансы, которые не всегда можно передать на английском языке. «Ваше предложение проходит через призму английского языка и того, насколько полно оно может быть выражено. В этой ситуации возможна потеря информации», — объясняет Габор Белла.
Исследователи указали на пример слова «рис». Во многих языках нет общего слова для обозначения риса, а вместо этого есть слова, которые определяют, является ли он сырым, вареным или коричневым. Таким образом, при переводе «рис вкусный» на суахили с помощью Google Translate результат — "mchele huu ni kitamu" — означает «этот сырой рис вкусный».
По словам исследователей, язык — нечто большее, чем набор слов и их значений; это средство выражения культурной идентичности, и именно так многие сообщества воспринимают мир. Без культурного контекста системы машинного перевода будут по-прежнему отдавать приоритет западному мировоззрению, что сделает практически невозможным правильную интерпретацию нюансов большинства неанглийских языков.
«Эти большие языковые модели разрабатываются сообществами информатиков, в основном финансируемыми богатыми западными университетами, где английский является языком по умолчанию, а все остальное — нишевая тема», — сказал Хелм.
Хотя Белла считает, что одним из возможных решений является привлечение носителей языка для обеспечения точности в работе, некоторые переводчики из Response Crisis Translation не уверены, что это поможет, особенно в кризисных ситуациях.
«Текст остается текстом, а человек есть человек», — сказал Ясин, переводчик из команды по изучению афганского языка. «Мы имеем дело с людьми, которые пережили травмирующий опыт, и наш подход основан на достаточном информировании [о травмирующем опыте]. Как переводчик, вы не можете недооценивать или переусердствовать [с переводом], но в то же время вы должны обладать эмпатией, чтобы передать их эмоции и чувства, а на это способен только человек».
Через шесть месяцев после того, как Карлос был впервые задержан, его, наконец, включили в программу организации Response Crisis Translation для получения юридической помощи.
По словам Карлоса, после встречи с Самарой, устным переводчиком, он почувствовал облегчение, ведь наконец нашелся кто-то, кто мог бы понять его и помочь.
С ее помощью Карлос в конечном счете получил убежище и сейчас подает заявление на получение вида на жительство.
«То, что кто-то говорит на моем языке, впервые после стольких месяцев — вселяет надежду», — сказал он.
Кстати, ежегодно бюро переводов ТранЭкспресс проводит ежегодное исследование онлайн-переводчиков. Каждый раз оно подтверждает, что онлайн-сервисы хоть и стараются улучшить качество перевода, но все ещё испытывают трудности при работе с текстом!