Крупное обновление ChatGPT позволяет ИИ видеть, слышать и говорить
ChatGPT, одна из ведущих нейронных сетей, получит революционное обновление, которое позволит ей видеть, слышать и говорить. Это расширяет круг задач, которые может решать модель, например, починить велосипед, определив его модель и детали по фотографии, или выдать рецепт на основе фото имеющихся ингредиентов.
Благодаря внедрению новых голосовых и графических функций пользователи теперь могут взаимодействовать с ChatGPT на более интуитивном уровне, как с помощью голосового общения, так и путем демонстрации изображений непосредственно ИИ. Обновление использует Whisper, систему распознавания речи с открытым исходным кодом, для транскрипции произнесенных слов в текст, обеспечивая беспрепятственное взаимодействие «голос – текст».
Обновление обещает пользователям множество практических применений: от решения математических задач с помощью простой фотографии до создания креативных решений для остатков еды. Интеграция визуальных и слуховых функций представляет собой скачок в универсальности модели и вовлеченности пользователей, обеспечивая более полный и интерактивный опыт работы с искусственным интеллектом.
Как сообщается в официальном пресс-релизе, «мы начинаем внедрять в ChatGPT новые голосовые и графические функции. Они предлагают новый, более интуитивно понятный тип интерфейса, позволяющий вести голосовой разговор или показывать ChatGPT, о чем вы говорите».
Что такое ChatGPT: