Разработчики OpenAI сделали значимый шаг в развитии искусственного интеллекта, выпустив глобальное обновление для чат-бота ChatGPT, которое позволяет ему "видеть, слышать и говорить". Это обновление открывает перед искусственным интеллектом возможность восприятия и обработки информации не только в текстовом формате. Хочешь пользоваться последними версиями ChatGPT 4 и Midjourney 5 в одном Телеграм боте без VPN? Тогда переходи в канал и забирай бота в закрепе!
Теперь обновленный чат-бот способен воспринимать и распознавать речь пользователей. Пользователи могут обращаться к нему голосом, что приближает его к виртуальным ассистентам, таким как Siri от Apple. Для активации речевых функций необходимо настроить их в приложении, и ChatGPT предоставляет выбор из пяти различных голосов, записанных профессиональными актерами. Разговоры с ChatGPT
Для распознавания речи ChatGPT использует систему с открытым исходным кодом под названием Whisper, которая способна создавать реалистичные синтетичес