Добавить в корзинуПозвонить
Найти в Дзене
ИА Бизнес Код

Google представил ИИ, который способен разговаривать, слушать и переводить

Новой разработкой Google в сфере ИИ-технологий стала мультимодальная языковая модель AudioPaLM. Особенностью разработки стала возможность обработки, генерации, а также перевода как текстового контента, так и голосового. В основе AudioPaLM лежат объединённые большая языковая модели PaLM-2 и генеративная аудиомодель AudioLM. Специальность PaLM-2 – анализ лингвистических знаний, а AudioLM, в свою очередь, способна идентифицировать говорящего и распознавать интонацию. По разработчиков, ИИ-алгоритм способен переводить с одного языка на другой на основе краткой устной подсказки. Другой важной особенностью AudioPaLM называют возможность преобразовывать речь в текст для ранее незнакомых языковых пар без необходимости предварительного обучения Кроме того, языковая модель способна запоминать паралингвистическую информацию — личность говорящего и его интонацию. Дата коммерческого запуска AudioPaLM будет объявлена позднее.

Новой разработкой Google в сфере ИИ-технологий стала мультимодальная языковая модель AudioPaLM. Особенностью разработки стала возможность обработки, генерации, а также перевода как текстового контента, так и голосового.

В основе AudioPaLM лежат объединённые большая языковая модели PaLM-2 и генеративная аудиомодель AudioLM. Специальность PaLM-2 – анализ лингвистических знаний, а AudioLM, в свою очередь, способна идентифицировать говорящего и распознавать интонацию.

По разработчиков, ИИ-алгоритм способен переводить с одного языка на другой на основе краткой устной подсказки. Другой важной особенностью AudioPaLM называют возможность преобразовывать речь в текст для ранее незнакомых языковых пар без необходимости предварительного обучения

Кроме того, языковая модель способна запоминать паралингвистическую информацию — личность говорящего и его интонацию. Дата коммерческого запуска AudioPaLM будет объявлена позднее.