Найти в Дзене

ChatGPT получит крупное обновление голосового режима

Похоже, OpenAI готовит серьёзное обновление голосового режима ChatGPT — и на этот раз речь не просто о косметических улучшениях. Компания намерена изменить сам формат общения с нейросетью: теперь разговаривать с ChatGPT можно будет прямо в обычном окне чата, без перехода в отдельный интерфейс и ограничений по контенту. Раньше голосовой режим выглядел довольно обособленно — на экране лишь анимация и субтитры. Всё, что требовало визуала — карты, изображения, ссылки — оставалось за бортом. Если хотелось увидеть что-то наглядно, приходилось завершать голосовую сессию и возвращаться в текстовый диалог. Теперь же OpenAI объединяет оба мира: говорить и смотреть станет можно одновременно. По данным энтузиастов, изучивших код свежей версии приложения ChatGPT v1.2025.294, голосовой режим теперь будет запускаться напрямую из основного интерфейса чата, без перехода в отдельный экран. На панели появятся кнопки микрофона и завершения беседы, а в окне диалога — динамический контент, который обновляет
Оглавление

Похоже, OpenAI готовит серьёзное обновление голосового режима ChatGPT — и на этот раз речь не просто о косметических улучшениях. Компания намерена изменить сам формат общения с нейросетью: теперь разговаривать с ChatGPT можно будет прямо в обычном окне чата, без перехода в отдельный интерфейс и ограничений по контенту.

Раньше голосовой режим выглядел довольно обособленно — на экране лишь анимация и субтитры. Всё, что требовало визуала — карты, изображения, ссылки — оставалось за бортом. Если хотелось увидеть что-то наглядно, приходилось завершать голосовую сессию и возвращаться в текстовый диалог. Теперь же OpenAI объединяет оба мира: говорить и смотреть станет можно одновременно.

Голос в самом чате

По данным энтузиастов, изучивших код свежей версии приложения ChatGPT v1.2025.294, голосовой режим теперь будет запускаться напрямую из основного интерфейса чата, без перехода в отдельный экран. На панели появятся кнопки микрофона и завершения беседы, а в окне диалога — динамический контент, который обновляется в реальном времени.

-2

Сценарий звучит просто: вы говорите — «Покажи прогноз погоды в Риме», — а ChatGPT не только отвечает голосом, но и выводит карту или погодную сводку прямо в чате. Без переключений, без пауз, без возвращения к старому интерфейсу.

Если коротко — ChatGPT учится разговаривать по-настоящему. Слушать, показывать и говорить — всё одновременно. Что ж, давно пора 😉.

Почему это вообще важно

До сих пор голосовой ChatGPT был чем-то вроде демонстрации технологий: приятный голос, плавная анимация — и всё. Но практической пользы не хватало, ведь видеть контекст нельзя. А значит, терялась одна из сильных сторон ChatGPT — умение не просто рассказывать, но и показывать.

Теперь OpenAI наконец объединяет голос и визуал. Это не просто апдейт интерфейса — это переход к аудио-визуальной модели общения. По сути, ChatGPT превращается в полноценного помощника, который реагирует не только на слова, но и на визуальные запросы.

Представьте: вы планируете поездку, спрашиваете про лучшие кафе в Барселоне, а ChatGPT не просто рассказывает, а тут же показывает карту, фото и рейтинг заведений. Всё в одном окне, без перерывов и без необходимости переключаться.

Конкуренция с Google

Google уже реализовала похожий подход в Gemini Live — там голосовое общение и визуальные элементы объединены в одном интерфейсе. Можно говорить, смотреть и листать — всё синхронно. OpenAI, похоже, идёт тем же путём, но с другим акцентом: не на быстроту реакции, а на глубину и гибкость взаимодействия.

Судя по темпам развития, новая версия голосового режима ChatGPT может появиться уже в ближайшие месяцы — возможно, одновременно с крупным обновлением самой модели. И если это произойдёт, OpenAI фактически создаст формат общения, где границы между текстом, голосом и визуалом просто исчезнут.

У Google приоритет — естественное звучание и мгновенные ответы, у OpenAI — интеллектуальная насыщенность и контекст. Идеальный сценарий — если ChatGPT объединит оба подхода: живой, эмоциональный голос и содержательные, визуально подкреплённые ответы.

Следующий шаг — эмоции и стиль

Кроме визуала, новая платформа, похоже, станет и полигоном для экспериментов с голосами и интонациями. OpenAI уже намекала, что пользователи смогут выбирать стиль общения: формальный, дружеский, нейтральный или даже слегка саркастичный (куда ж без этого 😅).

-3

Если всё реализуют так, как задумано, ChatGPT перестанет быть просто инструментом для ответов. Он станет настоящим собеседником — тем, с кем можно поговорить, поспорить, уточнить детали, а потом ненароком пошутить и при этом не потерять контекст разговора.

По сути, ChatGPT превращается в полноценного аудио-визуального помощника — такого, с кем можно не просто говорить, а смотреть на результат прямо во время диалога. Сказали «покажи кафе у моря» — и видите карту, фото и отзывы в ту же секунду. Всё это выглядит естественно, будто рядом сидит друг с ноутбуком, который параллельно ищет нужную информацию.

Ближе к естественному диалогу

OpenAI делает шаг в сторону «человеческого общения» — где важны не только слова, но и то, как они звучат, что показывают, и как быстро система откликается. В итоге ChatGPT перестаёт быть безликим помощником и всё больше напоминает живого собеседника, который и слышит, и видит, и понимает.

И да, выглядит это не как футуризм, а как вполне логичное развитие того, чего мы все ждали: нормальный, живой диалог с ИИ — без границ между голосом, текстом и визуалом.

А вы бы пользовались ChatGPT чаще, если бы можно было говорить с ним голосом и при этом видеть всё прямо в чате — карты, картинки, ссылки и результаты запросов?

Каждый ваш комментарий и каждый лайк и подписка на канал мотивируют продолжать и писать ещё больше качественных статей.

Подписывайтесь на наш Telegram-канал – там всегда много интересного!