Найти тему
75 подписчиков

PlayHT представлили PlayHT2.0, новую модель генерации разговорной речи. Размер нейронки увеличился в 10 раз и использует набор данных более чем из 1 миллиона часов речи.


Что может:

* Общение: обучена генерировать человекоподобный голос, подходящий для телефонных звонков, подкастов и аудиосообщений.

* Мгновенное клонирование голоса: очень точно воспроизводить голоса прослушав всего 3 секунды речи.

* Перевод на другой язык: клонировать и генерировать голоса почти на любом языке или акценте.

* Управление эмоциями: менять в реальном времени манеру речи в зависимости от установленной эмоции.

* Быстрая генерация: генерировать речь менее чем за 800 мс, с дальнейшими оптимизациями в будущем.

PlayHT представлили PlayHT2.0, новую модель генерации разговорной речи. Размер нейронки увеличился в 10 раз и использует набор данных более чем из 1 миллиона часов речи.
01:19
Около минуты