Исследователи в области искусственного интеллекта разработали новую модель языка "слушание во время говорения" (LSLM), которая позволяет одновременно слушать и говорить, продвигая вперед интерактивные речевые разговоры на основе искусственного интеллекта в режиме реального времени. LSLM использует TTS-декодер на основе токенов для генерации речи и потоковый самообучающийся кодер для ввода звука в реальном времени. Система способна определять очередность в режиме реального времени и реагировать на прерывания, что является ключевой особенностью естественного общения. Эксперименты показали устойчивость модели к шуму и чувствительность к различным инструкциям. Данная технология приближает нас к реалистичным разговорам с ИИ, позволяя машинам обрабатывать входящую речь во время разговора, что может произвести революцию во взаимодействии человека и ИИ, делая разговоры с машинами по-настоящему естественными и отзывчивыми. Друзья, для вас сегодня приготовлены уютные комнаты, освещенные лунным
НейроВидение Плейграунд: уютные комнаты Хоббита в Полнолуние
27 августа 202427 авг 2024
15
1 мин