Компания OpenAI, создавшая ChatGPT, представила новую модель для генерации и редактирования изображений под названием ChatGPT Images. Новая нейросеть позволяет точечно изменять изображение. В том числе, предлагать другое фокусное расстояние. Photar.ru протестировал возможности новой нейронки.
Особое внимание в компании уделяют возможностям точного редактирования. Как отмечается в блоге OpenAI, модель надёжнее следует инструкциям пользователя, внося изменения только в указанные детали и не меняя при этом общую композицию, освещение и внешний вид людей на фото.
Например, ChatGPT Images позволяет менять причёску или одежду на изображении, а также полностью переосмысливать концепцию снимка. В сети уже появились примеры: модель сначала сгенерировала фотографию скейтбордиста в стиле 1990-х годов, а затем по запросу изменила цвет одежды скейтбордиста, обстановку и значение скорости на знаке.
Photar.ru также опробовал новый инструмент. Забегая наперед — обложка данной статьи специально сгенерирована в ChatGPT Images.
Тест ChatGPT Images:
Для начала ChatGPT Images получил задачу сгенерировать фото по запросу:
Получаем вот такой результат и сразу следующий запрос (дабы проверить заявленное улучшение точного редактирования):
Теперь получаем вот такой ответ — очень даже неплохо:
Для сравнения ниже представлена картинка по первому запросу, а затем по второму (с просьбой изменить только фокусное расстояние:
Интересно отметить, что даже рисунок заднего плана остался незименным, с учетом смены объектива — он отдалился, но заснеженные ели остались теми же, в том же расположении. Однако цветопередача стала более холодная и изображение немного констрастнее.
Далее попробуем немного провести аналогию с инструментов улучшения фото:
ChatGPT Images с задачей, конечно, справился, однако потерялась насыщенность фото. Ну и протестируем стандартный вариант с котом, попробуем получить его фото в профиль, как уже делали ранее:
Для сравнения результат с Qwen-Image-Edit (слева), где видно, что ChatGPT Images генерирует изображение реалистичнее:
Далее — эксперимент с разворотом фронтально с заведомо «неизвестным» лицом. Соответсвенно лицо в данном формируется как предпочтет ИИ, а он немного не угадывает с телосложением (предпочитает делать человека немного худее).
Как видим, ChatGPT опять такие дает более реалистичную картинку по сравнению с конкурентом, у которого кстати смена ракурса на фото заявлялась как ключевая фишка.
А теперь дадим задачку посложнее в плане контекста.
Собственно такой сценарий использования может быть очень полезен создателям контента, посмотрим как справится новая модель в данной ситуации:
В целом раскрывается большое поле для экспериментов, но с задачей нейронка практически справляется. Если же обратить внимание на детали — то тут уже ошибки, как и всегда при использовании нейросетей (пропал наклон заголовка, текст на шильдике аккумулятора стал некорректный, изображение стрелок на аккумуляторе развернуло на 90 градусов и прочее).
При желании можно свести количество ошибок к минимуму, но потратив время. Возможно быстрее будет сделать все так сказать «наяву».
Но тем не менее, такого рода ошибки тянутся уже с самого появления функции фото-генераций ИИ. Реалистичность улучшается, но чем сложнее ситуация, тем больше переменных стоит учесть при запросе.
Однако стоит учесть что бесплатно имеется ограниченное число запросов в день.
Модель уже доступна всем пользователям ChatGPT, а для разработчиков — в виде API под названием GPT Image 1.5. Для открытия ссылки и использования в России понадобится VPN-сервис. Есть различные варианты подписок, как для бизнеса, так и для личного использования.
Из конкурентов Google также активно развивает свои инструменты для ИИ-редактирования изображений. Их модель Nano Banana, как отмечают наблюдатели, достигает поразительного реализма, имитируя даже мелкие дефекты, характерные для съёмки на смартфон.
И как всегда остаётся открытым вопрос, смогут ли подобные нейросети составить конкуренцию традиционной фотографии и заменить нас, фотографов, как вы считаете?
В реальности же нас продолжают радовать фототехнические новинки. Известный производитель анаморфотных объективов — компания Blazar выпустила новый Blazar Mantis 135mm T3.2 1.33х для полнокадровых камер. Оптика выпускается с байонетным креплением Sony E и PL-mount. Однако объектив имеет мануальное управление и может быть установлен фактически на любые камеры за счет сменного байонетного крепления.