Nvidia выпустила PersonaPlex — разговорную нейросеть, которая позволяет вести естественные диалоги в реальном времени с настройкой голоса и роли. Обычные голосовые помощники сначала распознают речь, потом обрабатывают текст, затем озвучивают результат — это дает выбор голоса, но делает речь неестественной и добавляет паузы. Новые системы вроде Moshi делают речь более живой, но фиксируют один голос и одну роль. PersonaPlex совмещает оба подхода: пользователь может выбрать любой голос и задать любую роль с помощью текстовой команды — от “умного помощника” до персонажа фантастики. Модель слушает и говорит одновременно, распознает, когда надо делать паузу или перебивать, и может использовать… Подробнее
Nvidia представила голосовой ИИ PersonaPlex для общения
26 января26 янв
~1 мин