201,8 тыс подписчиков
GPT-4 — последняя из больших языковых моделей семейства GPT, которая легла в основу первой версии популярного бота ChatGPT.
Наиболее важная и интересная часть обновления — мультимодальность. GPT-4 умеет принимать на вход и текст, и изображения. Благодаря этому функционалу пользователь может отправить боту любую зрительную или языковую задачу.
Модель также может интерпретировать картинки и «понимать» шутки. Например, разработчики показали модели пост пользователя Reddit (на фото), который поделился с сообществом неоправданно большой зарядкой для мобильного телефона.
На вопрос о том, почему фотографии могут быть смешными, модель ответила:
«На изображении показана упаковка для адаптера Lightning Cable. Смартфон с разъемом VGA, подключенный к порту зарядки с небольшим разъемом Lightning. Юмор на этом изображении исходит из абсурдности подключения большого устаревшего разъема VGA к маленькому современному порту для зарядки смартфона».
Конечно, возможности GRT-4 на этом не заканчиваются. Многие уже отмечают успех моделей ИИ в написании кода и задаются вопросом о потенциальном желании крупных технологических компаний заменить часть штата на хорошо обученные алгоритмы.
📸: OpenAI
1 минута
21 марта 2023
1329 читали