Добавить в корзинуПозвонить
Найти в Дзене
The Translator

Машинный перевод конфиденциальной информации: безопасно ли это?

Ответ на этот вопрос — нет, если речь идёт о бесплатных сервисах, и да, если вы используете платное МП-решение. Бесплатный машинный перевод может предоставляться разработчиками в обмен на сбор данных, которые используются для совершенствования движков путем редактирования полученных переводов. Общее правило гласит: при использовании бесплатного онлайн-переводчика из текстов необходимо удалять любую информацию, по которой можно идентифицировать её владельца. Рассмотрим частный случай В 2017 норвежская компания Statoil оказалась в центре скандала, связанного с переводом конфиденциальной информации с помощью бесплатного сервиса Translate.com. Сотрудники компании загрузили в онлайн-переводчик контракты, планы по сокращению персонала, письма об увольнении и другие документы, в результате чего корпоративная конфиденциальная информация — включая ФИО, адреса электронной почты, номера телефонов и другие личные данные — стала общедоступной и была проиндексирована поисковиками. Почему произошла у
Оглавление

Ответ на этот вопрос — нет, если речь идёт о бесплатных сервисах, и да, если вы используете платное МП-решение.

Бесплатный машинный перевод может предоставляться разработчиками в обмен на сбор данных, которые используются для совершенствования движков путем редактирования полученных переводов. Общее правило гласит: при использовании бесплатного онлайн-переводчика из текстов необходимо удалять любую информацию, по которой можно идентифицировать её владельца.

Рассмотрим частный случай

В 2017 норвежская компания Statoil оказалась в центре скандала, связанного с переводом конфиденциальной информации с помощью бесплатного сервиса Translate.com. Сотрудники компании загрузили в онлайн-переводчик контракты, планы по сокращению персонала, письма об увольнении и другие документы, в результате чего корпоративная конфиденциальная информация — включая ФИО, адреса электронной почты, номера телефонов и другие личные данные — стала общедоступной и была проиндексирована поисковиками.

Почему произошла утечка данных?

Всё, что вы загружаете в онлайн-переводчик, возможно попадёт в облако и останется на сервере. Онлайн-сервисы могут собирать тексты, которые переводят пользователи, и передавать их в выборку для обучения машинного перевода, а также извлекать из них информацию для рекламы и маркетинга и прочих целей.

Предупреждение на платформе автоматизации перевода Smartcat
Предупреждение на платформе автоматизации перевода Smartcat

Получается, что бесплатные сервисы перевода используют информацию пользователей?

По запросу «политика конфиденциальности Google Translate» поиск
выдает
следующий результат в числе первых:

Условия использования Google Cloud Translation API
Условия использования Google Cloud Translation API

На первый взгляд, приведенные выше условия использования сервиса кажутся безопасными для конфиденциальных данных. Однако на самом деле эти условия относятся к Google Cloud Translation API — платному сервису, политика конфиденциальности которого отличается от политики конфиденциальности Google Translate. Платный сервис обеспечивает более высокий уровень конфиденциальности.

А теперь обратимся к общим условиям использования сервисов Google. Из документа следует, что информация, загруженная на серверы Google с помощью таких служб, как Google Translate (бесплатной версии), может быть проанализирована алгоритмами сервиса и использована по усмотрению компании.

Условия использования сервисов Google
Условия использования сервисов Google

Рассмотрим политику конфиденциальности ещё одного сервиса перевода, DeepL. В документе говорится, что информация, загруженная пользователем на сервер, используется для обучения нейросети. Пользователей также предупреждают о том, что использование бесплатного сервиса для перевода персональных данных не допускается.

Политика конфиденциальности сервиса DeepL
Политика конфиденциальности сервиса DeepL

В условиях использования DeepL также говорится о том, что в случае нарушения условий соглашения пользователь обязан возместить ущерб компании.

Условия использования сервиса DeepL Pro
Условия использования сервиса DeepL Pro

Какие инструменты машинного перевода безопасны для конфиденциальных данных?

Определимся с понятиями. Конфиденциальная информация может означать всю информацию, не являющуюся общедоступной, включая документы, переписку, руководства, инструкции по оказанию услуг, отданные в устной или письменной форме, сведения, имеющие отношение к деятельности раскрывающей стороны или её клиентов, и проч.

Под разглашением конфиденциальной информации понимается любое действие или бездействие принимающей стороны, в результате которого такая информация в любой форме (в том числе с использованием технических средств) становится известной третьим лицам.

Таким образом, становится понятно, что при использовании бесплатных сервисов для перевода конфиденциальной информации вы можете понести ответственность за ее разглашение (при условии подписания NDA с контрагентом).

Для перевода конфиденциальной информации необходимо прибегать к платным услугам машинного перевода. Использование таких решений, которые хранят информацию в пределах локальной сети/частного облака и не взаимодействуют с внешней средой, позволит избежать утечки данных.

-6