Голосовые ассистенты наконец-то перестали звучать как роботы благодаря новой модели Realtime TTS-2. Она в 6 раз дешевле ElevenLabs и умеет даже понимающе вздохнуть в нужный момент. Большинство голосовых моделей звучат одинаково: стерильно и безжизненно. Даже самые продвинутые из них просто очень качественно имитируют человеческий тембр, но совершенно не чувствуют контекста. Если ты жалуешься ИИ на то, что у тебя сгорел дедлайн и развалился проект, он ответит тебе бодрым и оптимистичным голосом, который в этот момент хочется просто выключить. Inworld Realtime TTS-2 работает иначе. Она превращает ИИ в социального хамелеона. Модель анализирует твой темп речи и эмоциональное состояние прямо в процессе разговора. Если ты переходишь на шепот или начинаешь говорить медленнее, ИИ подстроится под тебя. Он может заговорщицки прошептать секрет или добавить в голос нотку сочувствия, когда это уместно. Это полноценный поведенческий ИИ. Представь театрального актёра, который считывает настроение зал
Голос ИИ Inworld TTS-2 в 6 раз дешевле ElevenLabs и умеет шептать
10 мая10 мая
3
3 мин