OpenAI представила голосовую модель, которая передаёт эмоции и позволяет говорить на любых языках OpenAI представила GPT‑Realtime — модель, которая умеет генерировать речь в режиме реального времени, передавая эмоции и интонацию, присущие человеческому голосу. Эта система строится на технологиях преобразования текста в речь, но отличается от предыдущих тем, что адаптирует голос под контекст и эмоции. По данным AIBase, GPT‑Realtime способна имитировать различные стили речи, изменяя тембр, скорость и тональность так, чтобы звучать более естественно. Кроме того, модель поддерживает мультимодальные взаимодействия: она может реагировать не только на текстовые, но и на визуальные и аудио сигналы. Одной из важных особенностей GPT‑Realtime является быстрый отклик: задержка между получением запроса и воспроизведением голоса составляет всего несколько миллисекунд, что делает возможными естественные диалоги. Модель может использоваться в колл‑центрах, виртуальных помощниках, образовательных прил
GPT-Realtime от OpenAI: что это за голосовой ИИ и как он работает
3 сентября 20253 сен 2025
1 мин