Найти в Дзене
Apple SPb Event

OpenAI убирала границы между текстом и речью обновив голосовой режим в ChatGPT

Компания OpenAI кардинально обновила голосовой функционал в своём приложении ChatGPT. Теперь голосовые беседы происходят непосредственно внутри текущего чата, а не в отдельном полноэкранном режиме, как это было раньше. Это нововведение направлено на создание более естественного и непрерывного опыта взаимодействия с искусственным интеллектом.​ Ключевая особенность апдейта — мультимодальность в реальном времени. Пока пользователь говорит, ответы нейросети мгновенно дублируются текстом в ленте чата. Более того, система теперь может по ходу разговора генерировать и показывать визуальные элементы, такие как карты или изображения, не прерывая голосовую сессию. Это решает главную проблему предыдущей версии интерфейса, когда для просмотра контента приходилось выходить из голосового режима.​ Ранее при использовании функции расширенного голосового режима запускалось отдельное окно с абстрактной визуализацией. Этот режим фактически выбрасывал пользователя из контекста текущей переписки, скрывая и

Компания OpenAI кардинально обновила голосовой функционал в своём приложении ChatGPT. Теперь голосовые беседы происходят непосредственно внутри текущего чата, а не в отдельном полноэкранном режиме, как это было раньше. Это нововведение направлено на создание более естественного и непрерывного опыта взаимодействия с искусственным интеллектом.​

Ключевая особенность апдейта — мультимодальность в реальном времени. Пока пользователь говорит, ответы нейросети мгновенно дублируются текстом в ленте чата. Более того, система теперь может по ходу разговора генерировать и показывать визуальные элементы, такие как карты или изображения, не прерывая голосовую сессию. Это решает главную проблему предыдущей версии интерфейса, когда для просмотра контента приходилось выходить из голосового режима.​

Ранее при использовании функции расширенного голосового режима запускалось отдельное окно с абстрактной визуализацией. Этот режим фактически выбрасывал пользователя из контекста текущей переписки, скрывая историю сообщений и нарушая рабочий процесс. Новый подход объединяет голос и текст в единую ленту, позволяя свободно прокручивать историю сообщений и возвращаться к предыдущим тезисам прямо во время разговора.​

Для консервативных пользователей OpenAI оставила возможность выбора. Те, кто привык к изолированному интерфейсу с «парящей сферой», могут вернуть его через настройки приложения: Настройки –> Голосовой режим –> Отдельный режим. Обновление уже распространяется для всех пользователей мобильных приложений и веб-версии ChatGPT.​

Данное изменение стало частью масштабной волны обновлений платформы, включающей запуск групповых чатов, внедрение новой модели GPT-5.1 и функции для исследования товаров перед покупками.

Ещё по теме: