Если тебя достали фотки в одинаковом стиле от нейросетей и ты выкупаешь их за долю секунды, тогда добро пожаловать. Я покажу, как может быть по-другому.
В марте–апреле 2025 года я решил поиграться с ChatGPT и его хвалёной моделью для изображений. Примерно все тогда делали картинки в стиле студии Гибли, помните?
До этого я пробовал неоднократно генерировать изображения в нейросетях с переменным успехом — плюс-минус раз в квартал. У меня было и теоретическое понимание, и кое-какая практика генерации через различные модели.
Но когда дело доходило до коммерческого применения в какой-то хотя бы немного специфической области, было понятно, что нейросети ещё на начальном пути и не готовы дать то, что ждёт от них коммерческий рынок.
Проиллюстрировать среднюю статью или новость — да. Выдать дизайн сауны — нет. У меня постоянные фейспалмы были от того, что ни одна модель толком не могла вагонку на стенах состыковать.
Вот такие интерьеры примерно генерировались, и это ещё очень хороший пример. Если не всматриваться в детали, то в целом даже ок. В большинстве случаев было сильно хуже.
Так вот, я пошёл в ChatGPT, потому что видел в различных каналах, как его начали хвалить со всех сторон в плане генерации изображений. И честно — я два выходных не мог от него оторваться. И это на бесплатном аккаунте. Лимиты тогда были сильно больше, чем сейчас; навскидку, генераций 20–25 в день можно было сделать. Я был просто в дичайшем восторге. Мне хотелось рассказать всем, что это за чудо техники такое. А полный шок у меня был от того, что он делал подписи на русском языке. Только иногда были ошибки в отдельных буквах.
Но на мой полёт фантазии и эксперименты мне лимитов не хватило. Однако хватило моих нагенерированных примеров, чтобы уговорить директора на работе, что нам это срочно надо. И я купил платную подписку. Нагенерировал фоток для рассылок и SMM, с десяток фоток с инфографикой для маркетплейсов.
Хайп быстро пошёл — уже через неделю вышел пост у «Акул ВБ» в Телеграме на эту тему примерами генерации фотосессий с одеждой. Но инерция и привычки — страшная сила. При всей доступности этого метода, до сих пор на маркетплейсах полно плохих фоток.
Что было дальше?
Вернёмся к сути. Я стал думать, как бы ещё коммерчески выгодно применить нейросеть и заодно прощупать её возможности. Деньги уплачены — надо использовать потенциал на максимум.
Я решил попробовать сделать фотосессию товара для Авито. Но я понимал, что тут ситуация кардинально противоположная маркетплейсам. Если там уже как стандарт — красочная карточка с инфографикой, характеристиками, вся сочная и рекламная (в среднем), то на Авито, наоборот, ценится максимальная естественность: фото в стиле «только что снял на то, что было под рукой и опубликовал».
И я решил имитировать фото в домашнем стиле на телефон через ChatGPT. К сожалению, примеры промтов не сохранились. Один раз я куда-то не туда нажал и потерял всю историю диалогов, думая, что удаляю только один диалог. Но уверяю вас, там не было ничего сложного — я напишу, как я примерно писал, а вы сможете это сделать по аналогии, и через несколько экспериментов у вас получится не хуже.
Как сгенерировать домашнее фото для Авито
Очень важно в чате сначала закинуть фото товара с разных ракурсов и попросить ChatGPT запомнить товар. Также нужно описать, из каких материалов он сделан, и так далее. Можете даже попросить его описать, что он видит на фотографии, а потом подкорректировать.
После этого есть два варианта.
- У вас есть референсные фото — то есть примеры того, как и в каком стиле вы хотите получить свои фотографии. Тогда вы прикрепляете референсы, просите ChatGPT запомнить стиль, цветовую гамму, композицию, освещение и всё остальное, что сами посчитаете нужным, и сгенерировать новое фото в таком же стиле, но с использованием товара, который прикрепляли выше.
- Описываете словами, что должно быть на изображении, и добавляете, что это должно быть фото, сделанное на бюджетный Android в домашней обстановке. А дальше включайте фантазию — можно написать про тусклое освещение и т.д.
Вот что получалось у меня.
Это испаритель из гималайской соли с 4 отверстиями на поддоне из нержавейки лежит на камнях в банной печи. По мне, так не отличить от реального.
Для Авито рекомендую делать горизонтальные фото формата 4:3
Таким образом делается целая серия фото.
Вот еще три примера мыла-скраба из гималайской соли.
Второй пример из той же серии. Всего было около 6 фото.
Третий пример
Таким образом можно показать и применение товара, и внешний вид с различных ракурсов и в различных интерьерах без использования специализированных сервисов.
Для данных генераций использовалось около десятка референсов самого мыла-скраба и не использовались референсы фото в домашнем стиле.
У меня не было цели кого-то обмануть этими как бы «фотографиями» — цель была показать применение данных товаров, которое по каким-то причинам было проблематично снять вживую. Например, сделать фотосессию в бане — это довольно затратное мероприятие: нужна баня, нужно привезти товары со склада или из шоурума, нужно какого-то представителя отправлять с фотографом и так далее. А здесь один человек, сидя в любой точке планеты, может сделать это самостоятельно.
Да, до сих пор нейросети многое не могут сгенерировать или делают не совсем так, и может уйти больше времени на попытки донести, что вам надо, без результата в итоге, чем сфоткали бы с нуля. Но также есть много ниш, где применение нейросетей оправдано, и результат очень впечатляющий.
А вы как считаете — от таких «фото» скорее польза или вред?