11,9 тыс подписчиков

Тест нового ИИ-генератора сверхреалистичных изображений ChatGPT Images

СегодняСегодня

3 мин

Компания OpenAI, создавшая ChatGPT, представила новую модель для генерации и редактирования изображений под названием ChatGPT Images. Новая нейросеть позволяет точечно изменять изображение. В том числе, предлагать другое фокусное расстояние. Photar.ru протестировал возможности новой нейронки. Особое внимание в компании уделяют возможностям точного редактирования. Как отмечается в блоге OpenAI, модель надёжнее следует инструкциям пользователя, внося изменения только в указанные детали и не меняя при этом общую композицию, освещение и внешний вид людей на фото. Например, ChatGPT Images позволяет менять причёску или одежду на изображении, а также полностью переосмысливать концепцию снимка. В сети уже появились примеры: модель сначала сгенерировала фотографию скейтбордиста в стиле 1990-х годов, а затем по запросу изменила цвет одежды скейтбордиста, обстановку и значение скорости на знаке. Photar.ru также опробовал новый инструмент. Забегая наперед — обложка данной статьи специально сгенери

Особое внимание в компании уделяют возможностям точного редактирования. Как отмечается в блоге OpenAI, модель надёжнее следует инструкциям пользователя, внося изменения только в указанные детали и не меняя при этом общую композицию, освещение и внешний вид людей на фото.

Например, ChatGPT Images позволяет менять причёску или одежду на изображении, а также полностью переосмысливать концепцию снимка. В сети уже появились примеры: модель сначала сгенерировала фотографию скейтбордиста в стиле 1990-х годов, а затем по запросу изменила цвет одежды скейтбордиста, обстановку и значение скорости на знаке.

Photar.ru также опробовал новый инструмент. Забегая наперед — обложка данной статьи специально сгенерирована в ChatGPT Images.

Тест ChatGPT Images:

Для начала ChatGPT Images получил задачу сгенерировать фото по запросу:

Получаем вот такой результат и сразу следующий запрос (дабы проверить заявленное улучшение точного редактирования):

Теперь получаем вот такой ответ — очень даже неплохо:

Для сравнения ниже представлена картинка по первому запросу, а затем по второму (с просьбой изменить только фокусное расстояние:

Интересно отметить, что даже рисунок заднего плана остался незименным, с учетом смены объектива — он отдалился, но заснеженные ели остались теми же, в том же расположении. Однако цветопередача стала более холодная и изображение немного констрастнее.

Далее попробуем немного провести аналогию с инструментов улучшения фото:

ChatGPT Images с задачей, конечно, справился, однако потерялась насыщенность фото. Ну и протестируем стандартный вариант с котом, попробуем получить его фото в профиль, как уже делали ранее:

Для сравнения результат с Qwen-Image-Edit (слева), где видно, что ChatGPT Images генерирует изображение реалистичнее:

Далее — эксперимент с разворотом фронтально с заведомо «неизвестным» лицом. Соответсвенно лицо в данном формируется как предпочтет ИИ, а он немного не угадывает с телосложением (предпочитает делать человека немного худее).

Как видим, ChatGPT опять такие дает более реалистичную картинку по сравнению с конкурентом, у которого кстати смена ракурса на фото заявлялась как ключевая фишка.

А теперь дадим задачку посложнее в плане контекста.

Собственно такой сценарий использования может быть очень полезен создателям контента, посмотрим как справится новая модель в данной ситуации:

В целом раскрывается большое поле для экспериментов, но с задачей нейронка практически справляется. Если же обратить внимание на детали — то тут уже ошибки, как и всегда при использовании нейросетей (пропал наклон заголовка, текст на шильдике аккумулятора стал некорректный, изображение стрелок на аккумуляторе развернуло на 90 градусов и прочее).

При желании можно свести количество ошибок к минимуму, но потратив время. Возможно быстрее будет сделать все так сказать «наяву».

Но тем не менее, такого рода ошибки тянутся уже с самого появления функции фото-генераций ИИ. Реалистичность улучшается, но чем сложнее ситуация, тем больше переменных стоит учесть при запросе.

Однако стоит учесть что бесплатно имеется ограниченное число запросов в день.

Модель уже доступна всем пользователям ChatGPT, а для разработчиков — в виде API под названием GPT Image 1.5. Для открытия ссылки и использования в России понадобится VPN-сервис. Есть различные варианты подписок, как для бизнеса, так и для личного использования.

Из конкурентов Google также активно развивает свои инструменты для ИИ-редактирования изображений. Их модель Nano Banana, как отмечают наблюдатели, достигает поразительного реализма, имитируя даже мелкие дефекты, характерные для съёмки на смартфон.

И как всегда остаётся открытым вопрос, смогут ли подобные нейросети составить конкуренцию традиционной фотографии и заменить нас, фотографов, как вы считаете?

В реальности же нас продолжают радовать фототехнические новинки. Известный производитель анаморфотных объективов — компания Blazar выпустила новый Blazar Mantis 135mm T3.2 1.33х для полнокадровых камер. Оптика выпускается с байонетным креплением Sony E и PL-mount. Однако объектив имеет мануальное управление и может быть установлен фактически на любые камеры за счет сменного байонетного крепления.