Компания Inworld выпустила TTS-1.5: модель преобразования текста в речь с очень естественной, выразительной речью в режиме реального времени с низкой задержкой и многоязычной поддержкой. Модель обеспечивает задержку в реальном времени менее 250 мс, оптимизированную экспрессию и стабильность для вовлечённости пользователей и стоит полцента в минуту. Полцента за минуту общения. Стоимость более чем в 25 раз дешевле, чем альтернативы: $5-10 за миллион символов против $120+ в других местах (например ElvenLabs). Доступно 15 языков (русский поддерживает). Лучшая стабильность и реалистичность, теперь доступны через API, плюс профессиональные варианты клонирования. Тестить тут #новости@dailyprompts
Новая модель преобразования текста в речь от Inworld
22 января22 янв
9
~1 мин