1 подписчик

Как я генерировал «фото» товара для Авито в домашнем стиле

20 января20 янв

4 мин

Если тебя достали фотки в одинаковом стиле от нейросетей и ты выкупаешь их за долю секунды, тогда добро пожаловать. Я покажу, как может быть по-другому. В марте–апреле 2025 года я решил поиграться с ChatGPT и его хвалёной моделью для изображений. Примерно все тогда делали картинки в стиле студии Гибли, помните? До этого я пробовал неоднократно генерировать изображения в нейросетях с переменным успехом — плюс-минус раз в квартал. У меня было и теоретическое понимание, и кое-какая практика генерации через различные модели. Но когда дело доходило до коммерческого применения в какой-то хотя бы немного специфической области, было понятно, что нейросети ещё на начальном пути и не готовы дать то, что ждёт от них коммерческий рынок. Проиллюстрировать среднюю статью или новость — да. Выдать дизайн сауны — нет. У меня постоянные фейспалмы были от того, что ни одна модель толком не могла вагонку на стенах состыковать. Вот такие интерьеры примерно генерировались, и это ещё очень хороший пример. Е

Оглавление

Что было дальше?
Как сгенерировать домашнее фото для Авито

Если тебя достали фотки в одинаковом стиле от нейросетей и ты выкупаешь их за долю секунды, тогда добро пожаловать. Я покажу, как может быть по-другому.

В марте–апреле 2025 года я решил поиграться с ChatGPT и его хвалёной моделью для изображений. Примерно все тогда делали картинки в стиле студии Гибли, помните?

До этого я пробовал неоднократно генерировать изображения в нейросетях с переменным успехом — плюс-минус раз в квартал. У меня было и теоретическое понимание, и кое-какая практика генерации через различные модели.

Но когда дело доходило до коммерческого применения в какой-то хотя бы немного специфической области, было понятно, что нейросети ещё на начальном пути и не готовы дать то, что ждёт от них коммерческий рынок.

Проиллюстрировать среднюю статью или новость — да. Выдать дизайн сауны — нет. У меня постоянные фейспалмы были от того, что ни одна модель толком не могла вагонку на стенах состыковать.

Вот такие интерьеры примерно генерировались, и это ещё очень хороший пример. Если не всматриваться в детали, то в целом даже ок. В большинстве случаев было сильно хуже.

Так вот, я пошёл в ChatGPT, потому что видел в различных каналах, как его начали хвалить со всех сторон в плане генерации изображений. И честно — я два выходных не мог от него оторваться. И это на бесплатном аккаунте. Лимиты тогда были сильно больше, чем сейчас; навскидку, генераций 20–25 в день можно было сделать. Я был просто в дичайшем восторге. Мне хотелось рассказать всем, что это за чудо техники такое. А полный шок у меня был от того, что он делал подписи на русском языке. Только иногда были ошибки в отдельных буквах.

Но на мой полёт фантазии и эксперименты мне лимитов не хватило. Однако хватило моих нагенерированных примеров, чтобы уговорить директора на работе, что нам это срочно надо. И я купил платную подписку. Нагенерировал фоток для рассылок и SMM, с десяток фоток с инфографикой для маркетплейсов.

Хайп быстро пошёл — уже через неделю вышел пост у «Акул ВБ» в Телеграме на эту тему примерами генерации фотосессий с одеждой. Но инерция и привычки — страшная сила. При всей доступности этого метода, до сих пор на маркетплейсах полно плохих фоток.

Что было дальше?

Вернёмся к сути. Я стал думать, как бы ещё коммерчески выгодно применить нейросеть и заодно прощупать её возможности. Деньги уплачены — надо использовать потенциал на максимум.

Я решил попробовать сделать фотосессию товара для Авито. Но я понимал, что тут ситуация кардинально противоположная маркетплейсам. Если там уже как стандарт — красочная карточка с инфографикой, характеристиками, вся сочная и рекламная (в среднем), то на Авито, наоборот, ценится максимальная естественность: фото в стиле «только что снял на то, что было под рукой и опубликовал».

И я решил имитировать фото в домашнем стиле на телефон через ChatGPT. К сожалению, примеры промтов не сохранились. Один раз я куда-то не туда нажал и потерял всю историю диалогов, думая, что удаляю только один диалог. Но уверяю вас, там не было ничего сложного — я напишу, как я примерно писал, а вы сможете это сделать по аналогии, и через несколько экспериментов у вас получится не хуже.

Как сгенерировать домашнее фото для Авито

Очень важно в чате сначала закинуть фото товара с разных ракурсов и попросить ChatGPT запомнить товар. Также нужно описать, из каких материалов он сделан, и так далее. Можете даже попросить его описать, что он видит на фотографии, а потом подкорректировать.

После этого есть два варианта.

У вас есть референсные фото — то есть примеры того, как и в каком стиле вы хотите получить свои фотографии. Тогда вы прикрепляете референсы, просите ChatGPT запомнить стиль, цветовую гамму, композицию, освещение и всё остальное, что сами посчитаете нужным, и сгенерировать новое фото в таком же стиле, но с использованием товара, который прикрепляли выше.
Описываете словами, что должно быть на изображении, и добавляете, что это должно быть фото, сделанное на бюджетный Android в домашней обстановке. А дальше включайте фантазию — можно написать про тусклое освещение и т.д.

Вот что получалось у меня.

Это испаритель из гималайской соли с 4 отверстиями на поддоне из нержавейки лежит на камнях в банной печи. По мне, так не отличить от реального.

Если бы тогда увидел такое фото у кого-то еще, я бы ни за что не догадался, что оно сгенерированное.

Для Авито рекомендую делать горизонтальные фото формата 4:3

Таким образом делается целая серия фото.

Вот еще три примера мыла-скраба из гималайской соли.

Девчонки, извините, потом только понял, что надо было ноготочки сделать. Простите мужика?

Второй пример из той же серии. Всего было около 6 фото.

Третий пример

Здесь уже чуть более профессональная домашненность, чувствуется стиль Пинтереста )

Таким образом можно показать и применение товара, и внешний вид с различных ракурсов и в различных интерьерах без использования специализированных сервисов.

Для данных генераций использовалось около десятка референсов самого мыла-скраба и не использовались референсы фото в домашнем стиле.

У меня не было цели кого-то обмануть этими как бы «фотографиями» — цель была показать применение данных товаров, которое по каким-то причинам было проблематично снять вживую. Например, сделать фотосессию в бане — это довольно затратное мероприятие: нужна баня, нужно привезти товары со склада или из шоурума, нужно какого-то представителя отправлять с фотографом и так далее. А здесь один человек, сидя в любой точке планеты, может сделать это самостоятельно.

Да, до сих пор нейросети многое не могут сгенерировать или делают не совсем так, и может уйти больше времени на попытки донести, что вам надо, без результата в итоге, чем сфоткали бы с нуля. Но также есть много ниш, где применение нейросетей оправдано, и результат очень впечатляющий.

А вы как считаете — от таких «фото» скорее польза или вред?