Найти в Дзене

Генерация изображений по референсу с искусственным интеллектом

От генерации обложек для YouTube-видео в едином стиле до создания изображений для сайта компании или соцсетей — с приложением «В стиле референса» можно решать множество прикладных задач. Оно учитывает стиль, цветовую палитру и композицию предложенного изображения при генерации, а также то, что указано в текстовом промпте. Коротко о нас и нашем канале: ИИ-сервис Aigital создает инструменты на основе нейросетей, чтобы пользователи и корпоративные команды могли легко и быстро решать маркетинговые и бизнес-задачи. Здесь мы делимся разборами наших ИИ-приложений и ассистентов. Например, в поле «Референс» вы добавляете изображение — обложку с любого #YouTube-видео, которая вам нравится по стилистике и цветовой палитре. В текстовом поле указываете, что вам нужна #обложка для Youtube-видео с рецептом приготовления шашлыков для кулинарного блога. В результате вы получаете изображение с шашлыками, подходящее по тематике для вашего блога, а по стилистике, палитре и композиции похожее на изображени

От генерации обложек для YouTube-видео в едином стиле до создания изображений для сайта компании или соцсетей — с приложением «В стиле референса» можно решать множество прикладных задач. Оно учитывает стиль, цветовую палитру и композицию предложенного изображения при генерации, а также то, что указано в текстовом промпте.

Коротко о нас и нашем канале: ИИ-сервис Aigital создает инструменты на основе нейросетей, чтобы пользователи и корпоративные команды могли легко и быстро решать маркетинговые и бизнес-задачи. Здесь мы делимся разборами наших ИИ-приложений и ассистентов.

Например, в поле «Референс» вы добавляете изображение — обложку с любого #YouTube-видео, которая вам нравится по стилистике и цветовой палитре. В текстовом поле указываете, что вам нужна #обложка для Youtube-видео с рецептом приготовления шашлыков для кулинарного блога. В результате вы получаете изображение с шашлыками, подходящее по тематике для вашего блога, а по стилистике, палитре и композиции похожее на изображение, которое вы добавляли в качестве референса.

Под капотом навык работает следующим образом:

  1. На первом этапе ИИ анализирует #референс — GPT-4o подробно описывает картинку с разных сторон, прорабатывает её стилистику.
  2. В параллель с этим другая нода GPT-4o берет текстовый запрос пользователя и переводит его на английский.
  3. На следующем шаге #GPT формирует объемный промпт, объединяя описание референса и текстовый запрос пользователя. Веса в нем расставлены так, чтобы нейронка понимала, на что следует обратить больше внимания, а на что меньше.
  4. Этот текстовый промпт отправляется во #FLUX1.1 Dev.
  5. FLUX1.1 Dev умеет работать с входящими изображениями, поэтому вместе с текстовым промптом приходит и картинка-референс. Получается двойной удар по задаче — и со стороны текстового описания референса, и визуально — с ориентиром на само исходное изображение.
  6. FLUX1.1 Dev сохраняет не только цветовую палитру, но и пропорции картинки-референса. Это особенно удобно, если требуется определенный размер изображения.
  7. Далее с помощью модели Clarity Upscaler улучшается качество изображения, повышается резкость и добавляются мелкие детали.
Генерация изображения в приложении «В стиле референса»
Генерация изображения в приложении «В стиле референса»

После чего пользователь получает готовое изображение.

Мы решили поэкспериментировать и сгенерировать стол со стульями на основе скрина нашего лендинга. Нейронка сохранила пропорции, забрала темно-серый на фон, а зеленый и белый в акценты. Результат генерации и скриншот с референсом ниже.

Скрин нашего лендинга Aigital.co
Скрин нашего лендинга Aigital.co
Изображение сгенерировано в навыке «В стиле референса»
Изображение сгенерировано в навыке «В стиле референса»

А если вам интересно читать о мире нейросетей, идеях и жизни проекта, подписывайтесь на наш телеграм-канал.

#Aigital #AI #ИИ #нейросети #генерацияизображений #графика #референс #приложения_и_ассистенты #обложкадляYouTubeвидео #искусственныйинтеллект