Рынок нейросетей для озвучки текста раскален до предела, и теперь в игру официально вступила компания Илона Маска. На днях xAI открыла для разработчиков доступ к своему новому продукту - Grok Text-to-Speech API. Если вы думаете, что это очередной скучный бот, который читает текст с интонацией вокзального диктора, то сильно ошибаетесь. Инженеры сделали ставку на максимальную человечность и гибкость. Что умеет новый голос от Grok? Во-первых, в арсенале есть 5 уникальных голосов (от энергичной Eve до профессионального Rex). Они звучат максимально естественно и поддерживают более 20 языков. Система сама понимает, на каком языке написан текст, и переключается на лету. Во-вторых, разработчикам дали потрясающую фишку - "выразительные теги". Прямо в тексте можно прописать команды: здесь нужно сделать глубокий вдох, тут - сымитировать смешок, а эту фразу произнести драматичным шепотом. Вы буквально режиссируете аудио как в театре. Зачем это нужно? Помимо создания контента для блогов, xAI метит
Илон Маск научил нейросеть смеяться и шептать: xAI запустила мощный генератор голоса Grok TTS 🎙🔥
17 марта17 мар
1 мин