18,4 тыс подписчиков

ChatGPT теперь может видеть, слышать и говорить. Open AI внедряет новые возможности

27 сентября 202327 сен 2023

1 мин

Крупное обновление ChatGPT позволяет ИИ видеть, слышать и говорить ChatGPT, одна из ведущих нейронных сетей, получит революционное обновление, которое позволит ей видеть, слышать и говорить. Это расширяет круг задач, которые может решать модель, например, починить велосипед, определив его модель и детали по фотографии, или выдать рецепт на основе фото имеющихся ингредиентов. Благодаря внедрению новых голосовых и графических функций пользователи теперь могут взаимодействовать с ChatGPT на более интуитивном уровне, как с помощью голосового общения, так и путем демонстрации изображений непосредственно ИИ. Обновление использует Whisper, систему распознавания речи с открытым исходным кодом, для транскрипции произнесенных слов в текст, обеспечивая беспрепятственное взаимодействие «голос – текст». Обновление обещает пользователям множество практических применений: от решения математических задач с помощью простой фотографии до создания креативных решений для остатков еды. Интеграция визуальны

Крупное обновление ChatGPT позволяет ИИ видеть, слышать и говорить

ChatGPT, одна из ведущих нейронных сетей, получит революционное обновление, которое позволит ей видеть, слышать и говорить. Это расширяет круг задач, которые может решать модель, например, починить велосипед, определив его модель и детали по фотографии, или выдать рецепт на основе фото имеющихся ингредиентов.

Благодаря внедрению новых голосовых и графических функций пользователи теперь могут взаимодействовать с ChatGPT на более интуитивном уровне, как с помощью голосового общения, так и путем демонстрации изображений непосредственно ИИ. Обновление использует Whisper, систему распознавания речи с открытым исходным кодом, для транскрипции произнесенных слов в текст, обеспечивая беспрепятственное взаимодействие «голос – текст».

Обновление обещает пользователям множество практических применений: от решения математических задач с помощью простой фотографии до создания креативных решений для остатков еды. Интеграция визуальных и слуховых функций представляет собой скачок в универсальности модели и вовлеченности пользователей, обеспечивая более полный и интерактивный опыт работы с искусственным интеллектом.

Как сообщается в официальном пресс-релизе, «мы начинаем внедрять в ChatGPT новые голосовые и графические функции. Они предлагают новый, более интуитивно понятный тип интерфейса, позволяющий вести голосовой разговор или показывать ChatGPT, о чем вы говорите».

Что такое ChatGPT:

Нейронные сети (Neural Networks)

80,9 тыс интересуются