Найти в Дзене
Otzyvmarketing

Google разработала автоматический переводчик устной речи Translatotron

Если вы еще не задаете себе вопрос «и зачем я учился пять лет на переводчика?», то уже пора. Компания Google постепенно отбирает хлеб как у переводчиков письменной речи, так и у специалистов синхронного перевода.

Накануне Google показала широкой общественности программу синхронного перевода Translatotron. Она использует нейронную сеть, распознает речь в автоматическом режиме и даже сохраняет паузы и интонацию говорящего. Короткая статья с описанием возможностей экспериментального алгоритма сегодня появилась в блоге компании.

В настоящее время большинство программ для перевода устной речи используют так называемую каскадную модель. Она работает по достаточно простому алгоритму, сначала распознает речь и получает ее транскрипцию, затем происходит машинный перевод, на последнем этапе текст преобразуется в аудиофайл. Даже сам Google использует это алгоритм в своем сервисе Translate.

Новинка Translatotron работает иначе, пропуская этап расшифровки речи. Алгоритм не работает с транскрипцией речи, а сразу обрабатывает исходную аудиозапись. Экспериментальная нейросеть производит синтез спектрограммы с речью на иностранном языке.

Разработчик отмечают, что такой способ перевода позволяет сохранять интонации, паузы и даже голос говорящего. Если это действительно так, то вскоре мы сможем услышать, как Дональд Трамп говорит на чистом русском языке «Сделаем Америку снова великой» с присущими ему интонациями и тембром. Это будет весело.

Правда, пока нейросеть Google еще не полностью освоила перевод и одновременное сохранение голоса говорящего, поэтому в этом случае смысл сказанного несколько искажается.

Разработчики компании оценили работу экспериментального сервиса BLEU-методом, который позволяет сравнить два варианта перевода. Новый алгоритм Google переводил испанскую речь на английский язык вместе с обычным машинным переводчиком. Оказалось, что пока разработчикам есть куда стремиться – каскадный метод все еще эффективнее нового «синтетического» метода перевода. Поэтому вопрос «зачем я пять лет учился на переводчика?» все еще не очень актуален.

Примеры перевода Translatotron можно увидеть в Github. Аудиозаписи, которые там можно найти, показывают, что программа действительно сохраняет голос. При этом в некоторых случаях перевод текста даже более точный, чем при использовании традиционных алгоритмов.

Авторы разработки уверены, что это только первый шаг. Специалисты Google продолжают работать, Translatotron – это экспериментальная версия, и можно ждать новых чудес от этой компании.

В разработке принимали участие такие команды, как Google Brain, Translate и Speech teams.

Кстати, вчера мы рассказывали о новом поисковике Diffbot для бизнеса, который смог обогнать Google по количеству проанализированных ресурсов интернета.