Добавить в корзинуПозвонить
Найти в Дзене
SunN1nja

Gemini 3.5 Live Translate: Google представила ИИ-переводчик, который говорит почти как человек

Еще недавно голосовой перевод напоминал общение через рацию: человек говорил фразу, система ждала окончания предложения, затем переводила его с заметной задержкой. Теперь Google делает следующий шаг в развитии языковых технологий. Компания представила Gemini 3.5 Live Translate — новую модель искусственного интеллекта для перевода речи в реальном времени, которая способна переводить разговор практически без пауз и сохранять особенности голоса собеседника. Это одна из самых амбициозных попыток стереть языковые барьеры между людьми. В Google напомнили, что начали работать над машинным переводом более двадцати лет назад. За это время технология превратилась из экспериментального проекта в глобальную платформу, которая ежемесячно переводит более триллиона слов для миллиардов пользователей по всему миру. Однако перевод текста — это лишь часть задачи. Самой сложной проблемой оставался живой разговор между людьми, говорящими на разных языках. Именно для этого была создана Gemini 3.5 Live Trans
Оглавление
Gemini 3.5 Live Translate: Google представила ИИ-переводчик, который говорит почти как человек
Gemini 3.5 Live Translate: Google представила ИИ-переводчик, который говорит почти как человек

Еще недавно голосовой перевод напоминал общение через рацию: человек говорил фразу, система ждала окончания предложения, затем переводила его с заметной задержкой.

Теперь Google делает следующий шаг в развитии языковых технологий. Компания представила Gemini 3.5 Live Translate — новую модель искусственного интеллекта для перевода речи в реальном времени, которая способна переводить разговор практически без пауз и сохранять особенности голоса собеседника.

Это одна из самых амбициозных попыток стереть языковые барьеры между людьми.

От машинного перевода к живому разговору

В Google напомнили, что начали работать над машинным переводом более двадцати лет назад. За это время технология превратилась из экспериментального проекта в глобальную платформу, которая ежемесячно переводит более триллиона слов для миллиардов пользователей по всему миру.

Однако перевод текста — это лишь часть задачи.

Самой сложной проблемой оставался живой разговор между людьми, говорящими на разных языках.

Именно для этого была создана Gemini 3.5 Live Translate.

Что умеет Gemini 3.5 Live Translate

Главная особенность новой модели заключается в том, что она не ждет окончания речи собеседника.

Большинство традиционных систем работают по принципу:

человек говорит → система ждет окончания фразы → выполняет перевод → озвучивает результат.

Из-за этого возникают паузы, которые делают разговор неестественным.

Gemini 3.5 Live Translate работает иначе.

Модель переводит речь непрерывно, практически одновременно с говорящим. При этом ИИ старается сохранить:

интонацию;

темп речи;

эмоциональную окраску;

высоту голоса.

В результате перевод звучит значительно более естественно и остается синхронизированным с оригинальной речью всего с задержкой в несколько секунд.

Более 70 языков без ручной настройки

Еще одной важной особенностью стала автоматическая работа с большим количеством языков.

Система самостоятельно определяет язык разговора и поддерживает более 70 языков.

Пользователю больше не нужно вручную выбирать исходный и целевой язык перед началом общения.

Для международных переговоров, путешествий и онлайн-встреч это может существенно упростить коммуникацию.

Где уже доступна новая технология

Google начала поэтапное внедрение Gemini 3.5 Live Translate сразу в несколько своих продуктов.

Разработчики уже могут протестировать технологию через Gemini Live API и Google AI Studio в режиме публичного предварительного доступа.

Корпоративные клиенты получат доступ к функции внутри Google Meet в рамках закрытого тестирования.

Обычные пользователи смогут воспользоваться новой системой через приложение Google Translate на Android и iOS.

Таким образом, технология одновременно выходит как для разработчиков, бизнеса, так и для массового рынка.

Новые возможности для разработчиков

Gemini 3.5 Live Translate ориентирована не только на конечных пользователей.

Google делает ставку на то, что сторонние компании смогут создавать собственные продукты на базе новой модели.

Система умеет работать с потоковой передачей речи в режиме реального времени и хорошо справляется даже в шумной среде.

По словам компании, это открывает возможности для создания:

сервисов синхронного перевода;

международных видеоконференций;

онлайн-обучения;

трансляций и стриминговых платформ;

голосовых помощников нового поколения.

Google также опубликовала демонстрационные проекты и примеры интеграции для разработчиков.

Крупные компании уже тестируют технологию

Одним из первых партнеров стала компания Grab.

Сервис проверяет возможности Gemini 3.5 Live Translate для общения между водителями и пассажирами, которые говорят на разных языках.

По данным компании, через платформу ежемесячно проходит более 10 миллионов голосовых звонков.

Если технология покажет хорошие результаты в реальных условиях, она может существенно упростить коммуникацию в международных сервисах.

Почему это важно

На протяжении многих лет переводчики пытались решить одну и ту же проблему: сделать разговор между людьми разных языков таким же естественным, как общение на родном языке.

Gemini 3.5 Live Translate делает заметный шаг именно в этом направлении.

Если технология действительно сможет качественно переводить речь без долгих задержек и при этом сохранять особенности голоса человека, то в ближайшие годы языковой барьер может стать гораздо менее значимой проблемой, чем сегодня.

Для пользователей это означает более комфортное общение.

Для бизнеса — возможность работать с клиентами по всему миру.

А для индустрии искусственного интеллекта это еще один пример того, как современные модели постепенно переходят от обработки текста к полноценному взаимодействию между людьми в реальном времени.