Добавить в корзинуПозвонить
Найти в Дзене
Neurogen

Higgs Audio v3 TTS

У нас очередная open-sourse TTS, но на этот раз все много интереснее, модель на 4B параметров, она также создана для живого общения, но умеет реагировать, делать паузы, расставлять акценты и держать диалог в риалтайме Есть русский В нее встроили inline теги за счет которых она меняет стиль,эмоции, скорость и тд не выходя с риалтайма Из коробки достигает WER/CER на 100+ языках. По метрике WER (чем ниже, тем лучше) устанавливает лучший результат среди открытых и коммерческих систем Особенно силён в паралингвистических сигналах (вздохи, смешки, интонации) и интонировании вопросов Локально пойдет на слабом железе, думаю минимум хватит 6-8vram и 10-15гб места на диске надо Playground Boson API HuggingFace Оф анонс UPD. Higgs Audio v3 TTS [Portable by Neurogen]

Higgs Audio v3 TTS

У нас очередная open-sourse TTS, но на этот раз все много интереснее, модель на 4B параметров, она также создана для живого общения, но умеет реагировать, делать паузы, расставлять акценты и держать диалог в риалтайме

Есть русский

В нее встроили inline теги за счет которых она меняет стиль,эмоции, скорость и тд не выходя с риалтайма

Из коробки достигает WER/CER на 100+ языках. По метрике WER (чем ниже, тем лучше) устанавливает лучший результат среди открытых и коммерческих систем

Особенно силён в паралингвистических сигналах (вздохи, смешки, интонации) и интонировании вопросов

Локально пойдет на слабом железе, думаю минимум хватит 6-8vram и 10-15гб места на диске надо

Playground

Boson API

HuggingFace

Оф анонс

UPD. Higgs Audio v3 TTS [Portable by Neurogen]