75 подписчиков
PlayHT представлили PlayHT2.0, новую модель генерации разговорной речи. Размер нейронки увеличился в 10 раз и использует набор данных более чем из 1 миллиона часов речи.
Что может:
* Общение: обучена генерировать человекоподобный голос, подходящий для телефонных звонков, подкастов и аудиосообщений.
* Мгновенное клонирование голоса: очень точно воспроизводить голоса прослушав всего 3 секунды речи.
* Перевод на другой язык: клонировать и генерировать голоса почти на любом языке или акценте.
* Управление эмоциями: менять в реальном времени манеру речи в зависимости от установленной эмоции.
* Быстрая генерация: генерировать речь менее чем за 800 мс, с дальнейшими оптимизациями в будущем.
Около минуты
11 августа 2023