Компания OpenAI значительно продвинулась в области глубокого обучения, представив свою последнюю модель GPT-4. В отличие от своего предшественника GPT-3.5, GPT-4 способен анализировать как изображения, так и текст, и показал результаты на "человеческом уровне" в ряде академических и профессиональных тестов. Создатели модели также утверждают, что она может интерпретировать схематические изображения, в том числе нарисованные от руки.
Чтобы усовершенствовать модель GPT-4, OpenAI использовала программы состязательного тестирования, а также вклад их собственного ChatGPT. Конечным результатом стала модель, которая на 82% реже отвечает на запросы о запрещенном контенте и на 40% чаще выдает правильные ответы.
Хотя разница между GPT-3.5 и GPT-4 может быть не сразу заметна в повседневном общении, она становится более очевидной по мере усложнения задач. OpenAI описывает GPT-4 как более надежный, творческий и способный обрабатывать более тонкие инструкции, чем его предшественник.
Способность GPT-4 распознавать изображения в настоящее время тестируется с помощью функции виртуального добровольца Be My Eyes, которая может отвечать на вопросы о присланных ей изображениях. Например, если пользователь отправит фотографию своего холодильника изнутри, виртуальный доброволец сможет не только правильно определить, что находится внутри, но и предложить рецепты и отправить пошаговые руководства по приготовлению.
Одно из самых значительных улучшений в модели GPT-4 - это ее инструментарий управляемости. OpenAI представила новую функцию API под названием "системные" сообщения, которые разработчики могут использовать для задания стилей и задач, предоставляя конкретные указания. По сути, системные сообщения - это инструкции, задающие тон и границы взаимодействия с ИИ.
Однако OpenAI признает, что GPT-4 не совершенен. У него все еще есть проблемы с "галлюцинациями" и ошибками в суждениях. Чатбот допустил несколько ошибок, например, назвал Элвиса Пресли "сыном актера". Разработчики также отмечают, что GPT-4 не знает о событиях, произошедших после сентября 2021 года, и иногда может совершать простые логические ошибки или быть слишком доверчивым.
Несмотря на свои недостатки, GPT-4 доступен через список ожидания API OpenAI и в ChatGPT Plus, премиум-плане OpenAI для ChatGPT. Чатбот Bing от Microsoft уже использует GPT-4, и он был интегрирован в новый уровень подписки на изучение языков для Duolingo. Генеральный директор OpenAI Сэм Альтман признает, что GPT-4 - не самая большая языковая модель и что человечеству еще далеко до создания идеального ИИ.
OpenAI представляет GPT-4: революционную модель ИИ, способную интерпретировать изображения и текст!
11 апреля 202311 апр 2023
2
2 мин
1