17 подписчиков
ChatGPT научился видеть, слышать и говорить: как это работает и какие ограничения.
OpenAI представила одно из самых значительных обновлений ChatGPT. Теперь нейросеть может распознавать голос пользователя в режиме реального времени и отвечать на него, а также анализировать изображения и распознавать объекты на них. Ранее мобильные приложения ChatGPT уже могли распознавать голос, преобразуя его в текст с помощью нейросети Whisper. Теперь в приложениях появится полноценный интерфейс для взаимодействия с нейросетью, которая будет отвечать пользователю. Голос пользователя также будет распознаваться с помощью Whisper, что говорит о неплохом уровне понимания человеческой речи. Важно отметить, что Whisper поддерживает и русский язык, поэтому есть большая вероятность, что общение в ChatGPT также будет доступно на русском языке. Реализация “зрения” оказалась для OpenAI более сложной и ответственной задачей, поскольку нейросети все еще могут ошибаться при распознавании объектов на изображениях.
На канале "Кибер Дзен" только актуальные новости из мира технологий! Подписывайся!
#chatgpt #чатgpt #нейросеть #ии #искуственныйинтеллект #whisper #технологии #программныйкод #кибердзен
Около минуты
1 октября 2023