Команда из Вашингтонского университета представила прорывную технологию для одновременного перевода речи нескольких собеседников, включая их интонации и пространственное положение. Разработка была представлена 30 апреля на конференции ACM CHI по взаимодействию человека и компьютера в Иокогаме, Япония. Исследование возглавили доктор философии Туочао Чен и профессор Шьям Голлакота, а также студенты и аспиранты школы компьютерных наук и инженерии Пола Дж. Аллена. Система под названием Transtial Speech Translation встроена в наушники с активным шумоподавлением и несколькими микрофонами. Она способна в реальном времени определять, кто и где говорит, переводить речь и воспроизводить ее с задержкой 2–4 секунды, при этом сохраняя тембр, интонацию и направление источника звука — как если бы каждый говорящий продолжал говорить своим голосом, но уже на языке пользователя. «Впервые мы сохранили не только смысл, но и звуковую индивидуальность каждого человека — и направление, откуда идет речь», — о
Инженеры создали наушники-переводчики с искусственным интеллектом – видео
12 мая 202512 мая 2025
29
2 мин