Найти тему
Цифровой Океан

ChatGPT теперь может видеть, слышать и говорить. Open AI внедряет новые возможности

Крупное обновление ChatGPT позволяет ИИ видеть, слышать и говорить

ChatGPT, одна из ведущих нейронных сетей, получит революционное обновление, которое позволит ей видеть, слышать и говорить. Это расширяет круг задач, которые может решать модель, например, починить велосипед, определив его модель и детали по фотографии, или выдать рецепт на основе фото имеющихся ингредиентов.

Благодаря внедрению новых голосовых и графических функций пользователи теперь могут взаимодействовать с ChatGPT на более интуитивном уровне, как с помощью голосового общения, так и путем демонстрации изображений непосредственно ИИ. Обновление использует Whisper, систему распознавания речи с открытым исходным кодом, для транскрипции произнесенных слов в текст, обеспечивая беспрепятственное взаимодействие «голос – текст».

Обновление обещает пользователям множество практических применений: от решения математических задач с помощью простой фотографии до создания креативных решений для остатков еды. Интеграция визуальных и слуховых функций представляет собой скачок в универсальности модели и вовлеченности пользователей, обеспечивая более полный и интерактивный опыт работы с искусственным интеллектом.

Как сообщается в официальном пресс-релизе, «мы начинаем внедрять в ChatGPT новые голосовые и графические функции. Они предлагают новый, более интуитивно понятный тип интерфейса, позволяющий вести голосовой разговор или показывать ChatGPT, о чем вы говорите».

Что такое ChatGPT:

OpenAI
60,9 тыс интересуются