Компания OpenAI презентовала обновленную версию генератора изображений DALL-E. В дальнейшем фирма намеревается добавить его в ChatGPT. По словам разработчика, обновление позволит генератору лучше обрабатывать запросы, работать с более сложными инструкциями и добавлять больше деталей на изображения.
Ныне существующие генераторы изображений очень часто пропускают целые слова, либо выдают картинку лишь с частично выполненными инструкциями. DALL-E 3 – это новый шаг в данном вопросе. Пользователи смогут делать изображения, полностью соответствующие запросам.
Предположительно технология сможет выполнить даже сложнейшую для ИИ задачу – нарисовать руки. Даже два одинаковых запроса на DALL-E 3 выглядят лучше, чем на предыдущей версии генератора. ИИ без труда передаст сцену по её описанию, учитывая взаимосвязь находящихся там объектов.
Технология в скором времени будет добавлена в ChatGPT и Enterprise. Объединение языковых навыков и генератора изображений даст возможность формировать детализированные картинки. Теперь пользователи смогут производить тонкую подстройку запроса, если первый результат не оправдает ожиданий.
Чат-бот будет генерировать индивидуальные подсказки для DALL-E 3, после чего генератор смоделирует изображение. Если конечная картинка заинтересует пользователя, но на ней будут отсутствовать необходимые детали, можно будет внести корректировки в запрос, включив в него пару уточнений.