Найти в Дзене

Как я генерировал «фото» товара для Авито в домашнем стиле

Если тебя достали фотки в одинаковом стиле от нейросетей и ты выкупаешь их за долю секунды, тогда добро пожаловать. Я покажу, как может быть по-другому. В марте–апреле 2025 года я решил поиграться с ChatGPT и его хвалёной моделью для изображений. Примерно все тогда делали картинки в стиле студии Гибли, помните? До этого я пробовал неоднократно генерировать изображения в нейросетях с переменным успехом — плюс-минус раз в квартал. У меня было и теоретическое понимание, и кое-какая практика генерации через различные модели. Но когда дело доходило до коммерческого применения в какой-то хотя бы немного специфической области, было понятно, что нейросети ещё на начальном пути и не готовы дать то, что ждёт от них коммерческий рынок. Проиллюстрировать среднюю статью или новость — да. Выдать дизайн сауны — нет. У меня постоянные фейспалмы были от того, что ни одна модель толком не могла вагонку на стенах состыковать. Вот такие интерьеры примерно генерировались, и это ещё очень хороший пример. Е
Оглавление

Если тебя достали фотки в одинаковом стиле от нейросетей и ты выкупаешь их за долю секунды, тогда добро пожаловать. Я покажу, как может быть по-другому.

В марте–апреле 2025 года я решил поиграться с ChatGPT и его хвалёной моделью для изображений. Примерно все тогда делали картинки в стиле студии Гибли, помните?

Источник: blog.okko.tv
Источник: blog.okko.tv

До этого я пробовал неоднократно генерировать изображения в нейросетях с переменным успехом — плюс-минус раз в квартал. У меня было и теоретическое понимание, и кое-какая практика генерации через различные модели.

Но когда дело доходило до коммерческого применения в какой-то хотя бы немного специфической области, было понятно, что нейросети ещё на начальном пути и не готовы дать то, что ждёт от них коммерческий рынок.

Результаты генерируемых изображений для коммерческого использования были слабоваты
Результаты генерируемых изображений для коммерческого использования были слабоваты

Проиллюстрировать среднюю статью или новость — да. Выдать дизайн сауны — нет. У меня постоянные фейспалмы были от того, что ни одна модель толком не могла вагонку на стенах состыковать.

Вот такие интерьеры примерно генерировались, и это ещё очень хороший пример. Если не всматриваться в детали, то в целом даже ок. В большинстве случаев было сильно хуже.

Обратите внимание на потолок
Обратите внимание на потолок

Так вот, я пошёл в ChatGPT, потому что видел в различных каналах, как его начали хвалить со всех сторон в плане генерации изображений. И честно — я два выходных не мог от него оторваться. И это на бесплатном аккаунте. Лимиты тогда были сильно больше, чем сейчас; навскидку, генераций 20–25 в день можно было сделать. Я был просто в дичайшем восторге. Мне хотелось рассказать всем, что это за чудо техники такое. А полный шок у меня был от того, что он делал подписи на русском языке. Только иногда были ошибки в отдельных буквах.

Но на мой полёт фантазии и эксперименты мне лимитов не хватило. Однако хватило моих нагенерированных примеров, чтобы уговорить директора на работе, что нам это срочно надо. И я купил платную подписку. Нагенерировал фоток для рассылок и SMM, с десяток фоток с инфографикой для маркетплейсов.

Хайп быстро пошёл — уже через неделю вышел пост у «Акул ВБ» в Телеграме на эту тему примерами генерации фотосессий с одеждой. Но инерция и привычки — страшная сила. При всей доступности этого метода, до сих пор на маркетплейсах полно плохих фоток.

Что было дальше?

Вернёмся к сути. Я стал думать, как бы ещё коммерчески выгодно применить нейросеть и заодно прощупать её возможности. Деньги уплачены — надо использовать потенциал на максимум.

Я решил попробовать сделать фотосессию товара для Авито. Но я понимал, что тут ситуация кардинально противоположная маркетплейсам. Если там уже как стандарт — красочная карточка с инфографикой, характеристиками, вся сочная и рекламная (в среднем), то на Авито, наоборот, ценится максимальная естественность: фото в стиле «только что снял на то, что было под рукой и опубликовал».

И я решил имитировать фото в домашнем стиле на телефон через ChatGPT. К сожалению, примеры промтов не сохранились. Один раз я куда-то не туда нажал и потерял всю историю диалогов, думая, что удаляю только один диалог. Но уверяю вас, там не было ничего сложного — я напишу, как я примерно писал, а вы сможете это сделать по аналогии, и через несколько экспериментов у вас получится не хуже.

Как сгенерировать домашнее фото для Авито

Очень важно в чате сначала закинуть фото товара с разных ракурсов и попросить ChatGPT запомнить товар. Также нужно описать, из каких материалов он сделан, и так далее. Можете даже попросить его описать, что он видит на фотографии, а потом подкорректировать.

После этого есть два варианта.

  1. У вас есть референсные фото — то есть примеры того, как и в каком стиле вы хотите получить свои фотографии. Тогда вы прикрепляете референсы, просите ChatGPT запомнить стиль, цветовую гамму, композицию, освещение и всё остальное, что сами посчитаете нужным, и сгенерировать новое фото в таком же стиле, но с использованием товара, который прикрепляли выше.
  2. Описываете словами, что должно быть на изображении, и добавляете, что это должно быть фото, сделанное на бюджетный Android в домашней обстановке. А дальше включайте фантазию — можно написать про тусклое освещение и т.д.

Вот что получалось у меня.

Это испаритель из гималайской соли с 4 отверстиями на поддоне из нержавейки лежит на камнях в банной печи. По мне, так не отличить от реального.

Если бы тогда увидел такое фото у кого-то еще, я бы ни за что не догадался, что оно сгенерированное.
Если бы тогда увидел такое фото у кого-то еще, я бы ни за что не догадался, что оно сгенерированное.
Для Авито рекомендую делать горизонтальные фото формата 4:3

Таким образом делается целая серия фото.

Вот еще три примера мыла-скраба из гималайской соли.

Девчонки, извините, потом только понял, что надо было ноготочки сделать. Простите мужика?
Девчонки, извините, потом только понял, что надо было ноготочки сделать. Простите мужика?

Второй пример из той же серии. Всего было около 6 фото.

Делаем фото в разных локациях
Делаем фото в разных локациях

Третий пример

Здесь уже чуть более профессональная домашненность, чувствуется стиль Пинтереста )
Здесь уже чуть более профессональная домашненность, чувствуется стиль Пинтереста )

Таким образом можно показать и применение товара, и внешний вид с различных ракурсов и в различных интерьерах без использования специализированных сервисов.

Для данных генераций использовалось около десятка референсов самого мыла-скраба и не использовались референсы фото в домашнем стиле.

У меня не было цели кого-то обмануть этими как бы «фотографиями» — цель была показать применение данных товаров, которое по каким-то причинам было проблематично снять вживую. Например, сделать фотосессию в бане — это довольно затратное мероприятие: нужна баня, нужно привезти товары со склада или из шоурума, нужно какого-то представителя отправлять с фотографом и так далее. А здесь один человек, сидя в любой точке планеты, может сделать это самостоятельно.

Да, до сих пор нейросети многое не могут сгенерировать или делают не совсем так, и может уйти больше времени на попытки донести, что вам надо, без результата в итоге, чем сфоткали бы с нуля. Но также есть много ниш, где применение нейросетей оправдано, и результат очень впечатляющий.

А вы как считаете — от таких «фото» скорее польза или вред?