Добавить в корзинуПозвонить
Найти в Дзене
4pda.to

Генератор картинок GPT Image обновился. Сравниваем с Nano Banana Pro

В свежей визуальной модели OpenAI версии 1.5 заявляют о кратном приросте скорости и точности. Ранее внимание публики привлекла Nano Banana Pro от Google — аналогичный инструмент высокого качества. Приводим четыре сценария, в которых эксперты столкнули популярные нейросети. В одном из тестов моделям предложили создать снимок скейтбордиста в Лос-Анджелесе в духе документальной уличной фотографии конца 90-х. Запрос содержал конкретные требования: 35-мм плёнка, зернистость, мягкий контраст и отсутствие современной цифровой резкости. Победу одержала GPT Image 1.5. Нейронка от OpenAI корректно воспроизвела текстуру плёночного зерна и общую атмосферу ретроснимка. Nano Banana Pro, напротив, проигнорировала часть инструкций, выдав слишком чистое и детализированное изображение, которое не соответствовало запрошенной эстетике «мыльницы» прошлого века. Второй сценарий проверял способность алгоритмов имитировать современную мобильную съёмку. Задача заключалась в генерации фото девушки в амстердамск
Оглавление
   Генератор картинок GPT Image обновился. Сравниваем с Nano Banana Pro
Генератор картинок GPT Image обновился. Сравниваем с Nano Banana Pro

В свежей визуальной модели OpenAI версии 1.5 заявляют о кратном приросте скорости и точности. Ранее внимание публики привлекла Nano Banana Pro от Google — аналогичный инструмент высокого качества. Приводим четыре сценария, в которых эксперты столкнули популярные нейросети.

-2

Попадание в стилистику

В одном из тестов моделям предложили создать снимок скейтбордиста в Лос-Анджелесе в духе документальной уличной фотографии конца 90-х. Запрос содержал конкретные требования: 35-мм плёнка, зернистость, мягкий контраст и отсутствие современной цифровой резкости.

Победу одержала GPT Image 1.5. Нейронка от OpenAI корректно воспроизвела текстуру плёночного зерна и общую атмосферу ретроснимка. Nano Banana Pro, напротив, проигнорировала часть инструкций, выдав слишком чистое и детализированное изображение, которое не соответствовало запрошенной эстетике «мыльницы» прошлого века.

Фотореализм

Второй сценарий проверял способность алгоритмов имитировать современную мобильную съёмку. Задача заключалась в генерации фото девушки в амстердамском кафе весенним утром, снятого на iPhone с малой глубиной резкости.

В этом случае лидерство досталось Nano Banana Pro. Ей удалось передать характерную для смартфонных камер картинку и ощущение морозного утра. Более того, модель проявила инициативу, добавив на фон вывески, похожие на реальные, что усилило эффект присутствия. Вариант GPT Image 1.5 оказался слишком качественным — характерный пластиковый блеск нейросети скрыть не удалось.

Впрочем, такой итог заметен не всегда. Пользователь Reddit приводит множество фотореалистичных примеров, где результаты варьируются. GPT отлично имитирует плохую камеру в ночных условиях, тогда как Banana выдаёт профессиональный, но слишком вычищенный кадр. А вот костёр смотрится естественнее у Google — выручает имитация неидеальной экспозиции, присущей телефонам.

Селфи в зеркале тоже получились чуть правдоподобнее за счёт отражения вспышки от разводов на стекле, хотя здесь почти паритет. Словом, изъяны оптики добавляют натуральности, но иногда нужны и более «чистые» фото — всё зависит от контекста запроса.

Точечное редактирование

Один из сложнейших тестов — внесение правок в уже готовое изображение без искажения остальных объектов. Журналисты взяли исходную картинку и последовательно просили нейросети изменить время суток с ночи на день, заменить диван на деревянный и поменять ракурс камеры.

Nano Banana Pro справилась с задачей аккуратнее. GPT Image 1.5 начал ошибаться на первых этапах: при смене освещения алгоритм зачем-то перерисовал здания на заднем плане, а при замене мебели исказил конструкцию стоящего рядом столика. Смена ракурса оказалась непосильной задачей для обеих систем, но продукт Google всё же лучше сохранил целостность исходной композиции. Интересно, что исходник был создан в GPT, но даже со своим «родным» изображением модель OpenAI сработала хуже конкурента.

Сюжетная последовательность

Финальное испытание коснулось создания раскадровки для короткометражного фильма. Требовалось сгенерировать три последовательных кадра: завязку, конфликт и развязку, сохранив внешность персонажа.

-5

GPT Image 1.5 подошла к заданию формально и попыталась уместить всё в одну невыразительную иллюстрацию. Nano Banana Pro выдала серию более стилистически приятных изображений, которые четко передавали развитие сюжета. Более того, модель добавила поясняющий текст, логично связывающий переходы между сценами.

В итоге, несмотря на улучшения, GPT Image 1.5 пока выглядит догоняющей. Модель нередко хороша в специфических задачах: например, кадрах с эффектом зерна. Но аналог от Google сильно выигрывает в скорости и способен выдавать несколько результатов за раз. В плане удержания контекста при редактировании и рендеринге текста преимущество также остаётся за Nano Banana Pro.