Изначально доступны 5 уникальных голосов: Eve, Ara, Rex, Sal и Leo. Самое интересное —; управление эмоциями и интонацией прямо в тексте. Можно писать: «Так я зашёл и [пауза] вот оно. [смех] Я просто не поверил своим глазам!». Или использовать теги, вроде, (для шёпота), (для замедления). Паузы, смех, вздохи, дыхание, изменения громкости, высоты тона и скорости —; судя по первым отзывам всё это работает отлично и без дополнительных настроек. Изображение Grok API поддерживает WebSocket для потоковой передачи речи в реальном времени и разные аудиоформаты, включая MP3 и mu-law.
Компания xAI Илона Маска представила новый Text-to-Speech API —; инструмент, который превращает обычный текст в живую, выразительную речь
ВчераВчера
~1 мин