В области искусственного интеллекта гонка открытых и закрытых решений продолжается уже не первый год, и недавно в этом соревновании произошло интересное событие — компания Resemble AI выпустила открытую модель Chatterbox для преобразования текста в речь (TTS), доступную под лицензией MIT. Почему это важная новость и какие перспективы она открывает? Первое, что бросается в глаза, — это впечатляющие возможности новой модели: 🎯 Контроль эмоций.
Модель поддерживает контроль над интенсивностью эмоций. Это значит, что теперь голосовые помощники или игровые персонажи смогут звучать гораздо выразительнее и реалистичнее. Разработчики отмечают, что даже небольшие изменения уровня эмоциональности могут значительно повлиять на восприятие речи. ⚡️ Ультра-низкая задержка (200 мс).
Одно из самых важных технических достижений Chatterbox — крайне низкое время отклика. Для приложений, где важна мгновенная обратная связь (например, игры, интерактивные помощники, чат-боты), такая скорость отклика критиче