Найти тему
201,8 тыс подписчиков

GPT-4 — последняя из больших языковых моделей семейства GPT, которая легла в основу первой версии популярного бота ChatGPT.


Наиболее важная и интересная часть обновления — мультимодальность. GPT-4 умеет принимать на вход и текст, и изображения. Благодаря этому функционалу пользователь может отправить боту любую зрительную или языковую задачу.

Модель также может интерпретировать картинки и «понимать» шутки. Например, разработчики показали модели пост пользователя Reddit (на фото), который поделился с сообществом неоправданно большой зарядкой для мобильного телефона.

На вопрос о том, почему фотографии могут быть смешными, модель ответила:

«На изображении показана упаковка для адаптера Lightning Cable. Смартфон с разъемом VGA, подключенный к порту зарядки с небольшим разъемом Lightning. Юмор на этом изображении исходит из абсурдности подключения большого устаревшего разъема VGA к маленькому современному порту для зарядки смартфона».

Конечно, возможности GRT-4 на этом не заканчиваются. Многие уже отмечают успех моделей ИИ в написании кода и задаются вопросом о потенциальном желании крупных технологических компаний заменить часть штата на хорошо обученные алгоритмы.


📸: OpenAI
GPT-4 — последняя из больших языковых моделей семейства GPT, которая легла в основу первой версии популярного бота ChatGPT.  Наиболее важная и интересная часть обновления — мультимодальность.
1 минута
1329 читали