Найти в Дзене
Нейросети & ИИ

OpenAI добавила в ChatGPT голосовые чаты с ботом и поддержку изображений

OpenAI сделала новый шаг в развитии своего продукта ChatGPT, расширив возможности этой нейросети для взаимодействия с пользователями. Теперь, помимо текстовых команд, пользователи получили доступ к загрузке изображений и голосовому общению с чат-ботом. Эти новые функции будут в первую очередь доступны подписчикам ChatGPT Plus и корпоративным пользователям в течение следующих двух недель. Для остальных пользователей они также станут доступны, но чуть позже. Важно отметить, что голосовой чат можно использовать только в приложении (для устройств Android доступен в России с VPN, для iOS пока только в США) , тогда как загрузка изображений будет доступна на всех платформах. Чтобы воспользоваться голосовым запросом, вам потребуется перейти в настройки приложения, выбрать "новые функции приложения" и активировать "разговор голосом". Затем на главном экране появится кнопка с изображением наушников. Нажав на неё, вы сможете выбрать один из пяти голосов, которыми будет отвечать чат-бот. Помимо эт

OpenAI сделала новый шаг в развитии своего продукта ChatGPT, расширив возможности этой нейросети для взаимодействия с пользователями. Теперь, помимо текстовых команд, пользователи получили доступ к загрузке изображений и голосовому общению с чат-ботом.

Эти новые функции будут в первую очередь доступны подписчикам ChatGPT Plus и корпоративным пользователям в течение следующих двух недель. Для остальных пользователей они также станут доступны, но чуть позже. Важно отметить, что голосовой чат можно использовать только в приложении (для устройств Android доступен в России с VPN, для iOS пока только в США) , тогда как загрузка изображений будет доступна на всех платформах.

Чтобы воспользоваться голосовым запросом, вам потребуется перейти в настройки приложения, выбрать "новые функции приложения" и активировать "разговор голосом". Затем на главном экране появится кнопка с изображением наушников. Нажав на неё, вы сможете выбрать один из пяти голосов, которыми будет отвечать чат-бот. Помимо этого, для озвучивания OpenAI сотрудничала с профессиональными дикторами.

Эта функция основана на модели, способной преобразовывать текст в голос, а также на системе распознавания речи Whisper. Spotify также будет использовать эту систему для голосового перевода подкастов на разные языки.

Кроме голосовых запросов, теперь можно загружать изображения. Например, вы можете сфотографировать содержимое своего холодильника, и чат-бот предложит вам рецепт на основе доступных продуктов. Или сделать снимок своего велосипеда и попросить ChatGPT объяснить, как опустить сиденье. Если нужно выделить детали на изображении, можно даже рисовать на нем и загружать дополнительные картинки.

Совершенно новые возможности в ChatGPT предоставлены моделями GPT-3.5 и GPT-4. Эти передовые модели активно применяют свои уникальные языковые способности для анализа и интерпретации разнообразных изображений, включая фотографии, скриншоты экранов и документы, которые включают в себя и текст, и графические элементы. Теперь ChatGPT способен взаимодействовать с данными в более широком формате, что открывает широкий спектр возможностей для более глубокого и разнообразного общения и решения задач.