Общение с группой людей, говорящих на разных языках, создает сложности для автоматических переводчиков. Новая разработка из США стремится упростить этот процесс, используя комбинацию распознавания пространства и голосового клонирования. Ученые из Вашингтонского университета разработали систему «пространственного перевода речи». Она встроена в модифицированные шумоподавляющие наушники и предназначена для ситуаций, когда одновременно говорят несколько человек. Устройство не просто переводит речь, а отслеживает говорящих в пространстве и сохраняет выразительные особенности их голосов. Технология использует встроенные микрофоны и алгоритмы, которые работают как своеобразный радар. Система определяет, сколько человек говорит рядом, где они находятся и как перемещаются. Она следит за направлением источников звука и обновляет свою модель в реальном времени. В результате каждый голос переводится с небольшой задержкой — от двух до четырех секунд — с сохранением громкости, интонации и направлени
В США создали систему наушников, переводящую речь сразу нескольких собеседников
10 мая 202510 мая 2025
28
1 мин