1835 подписчиков

ByteDance представила «Seeduplex»: полнодуплексную голосовую модель на базе ИИ

9 апреля9 апр

1 мин

Новая модель Seeduplex от ByteDance обеспечивает полнодуплексное голосовое взаимодействие в реальном времени в Doubao, делая ИИ-звонки более естественными и отзывчивыми. — pandaily.com ByteDance официально запустила Seeduplex — нативную полнодуплексную большую голосовую модель, разработанную для обеспечения более естественного диалога в режиме реального времени. По сравнению с предыдущей полудуплексной сквозной голосовой моделью Doubao, Seeduplex использует новую структуру «прослушивание во время говорения», что значительно повышает плавность и отзывчивость диалога. По данным компании, модель демонстрирует два ключевых прорыва: Многомерные оценки показывают, что Seeduplex превосходит традиционные полудуплексные системы и основные функции голосовых вызовов в ведущих приложениях по плавности и ритму диалога. Точность смены говорящего улучшилась на 8%, приближая взаимодействие к естественному человеческому диалогу. Масштабное A/B-тестирование дополнительно указывает на улучшения по ключев

ByteDance официально запустила Seeduplex — нативную полнодуплексную большую голосовую модель, разработанную для обеспечения более естественного диалога в режиме реального времени.

По сравнению с предыдущей полудуплексной сквозной голосовой моделью Doubao, Seeduplex использует новую структуру «прослушивание во время говорения», что значительно повышает плавность и отзывчивость диалога.

По данным компании, модель демонстрирует два ключевых прорыва:

Надежная обработка шума: Благодаря возможности непрерывного прослушивания Seeduplex лучше понимает акустическую среду пользователей, эффективно отфильтровывая фоновый шум и постороннюю речь. В сложных сценариях ложные ответы и непреднамеренные прерывания сокращаются на 50% по сравнению с полудуплексными моделями.
Динамическая смена говорящего: Сочетая речевые и семантические сигналы, модель точнее определяет, когда пользователь закончил говорить. Это обеспечивает более естественный темп — модель терпеливо ждет во время пауз и быстро отвечает, когда это уместно. Прерывания сокращены на 40% по сравнению с предыдущими моделями.

Многомерные оценки показывают, что Seeduplex превосходит традиционные полудуплексные системы и основные функции голосовых вызовов в ведущих приложениях по плавности и ритму диалога. Точность смены говорящего улучшилась на 8%, приближая взаимодействие к естественному человеческому диалогу.

Масштабное A/B-тестирование дополнительно указывает на улучшения по ключевым пользовательским метрикам, включая продолжительность звонка и удержание. Общая удовлетворенность звонками выросла на 8,34%, в то время как жалобы на прерывания, медленные ответы и ошибки значительно снизились.

Seeduplex теперь полностью внедрена в приложении Doubao, улучшая функцию голосовых вызовов за счет большей естественности, более быстрого времени отклика и повышенной устойчивости к шуму. Пользователи могут получить доступ к этой функции, обновив приложение до последней версии и выбрав опцию «Вызов» в интерфейсе чата.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Pandaily

Оригинал статьи

Гаджеты и электроника

5,73 млн интересуются