Добавить в корзинуПозвонить
Найти в Дзене
ИндиВосток

Как генерировать несколько персонажей в кадре: ошибки и рабочая схема

Сегодня мы рассмотрим генерацию нескольких персонажей в 1 кадре. Кто пытался сделать знают насколько это невыполнимая задача. Особенно если надо сделать 2 конкретных персонажей. Описание внешности и одежды постоянно смешивается что приводит к результатам ниже среднего. В этой статье я дам вам формулу для генерации 2-3 персонажей в кадре со стабильным результатом. Для начала приведу неудачные примеры своих генераций. Путем проб и ошибок я подбирал рабочую структуру запросов в Шедевруме. 2 разных девушки. 1. Кейт Денсон из dbd. 2. Джейн Ромеро из dbd. Ночной портрет, на фоне лес, заброшенная хижина, густой туман, искры костра, cвет луны, мистическая атмосфера, хоррор, 8k Персонажи похоже друг на друга и даже я как фанат игры затрудняюсь сказать кто где стоит. Я пытался сделать некоторую логическую структуру в промпте, но это не помогло. Посмотрим что будет с персонажами которые по одиночке получаются очень хорошо. 3 разных девушки. 1. Ада Вонг. 2. Ребекка Чемберс. 3. Джилл Валента
Оглавление

Сегодня мы рассмотрим генерацию нескольких персонажей в 1 кадре. Кто пытался сделать знают насколько это невыполнимая задача. Особенно если надо сделать 2 конкретных персонажей.

Описание внешности и одежды постоянно смешивается что приводит к результатам ниже среднего. В этой статье я дам вам формулу для генерации 2-3 персонажей в кадре со стабильным результатом.

Неудачные попытки

Для начала приведу неудачные примеры своих генераций. Путем проб и ошибок я подбирал рабочую структуру запросов в Шедевруме.

2 разных девушки.
1. Кейт Денсон из dbd.
2. Джейн Ромеро из dbd.
Ночной портрет, на фоне лес, заброшенная хижина, густой туман, искры костра, cвет луны, мистическая атмосфера, хоррор, 8k

Персонажи похоже друг на друга и даже я как фанат игры затрудняюсь сказать кто где стоит. Я пытался сделать некоторую логическую структуру в промпте, но это не помогло.

Посмотрим что будет с персонажами которые по одиночке получаются очень хорошо.

3 разных девушки.
1. Ада Вонг.
2. Ребекка Чемберс.
3. Джилл Валентайн.
Ночной портрет, на фоне лес, заброшенная хижина, густой туман, искры костра, cвет луны, мистическая атмосфера, хоррор, 8k

К сожалению, даже тут происходит смешение персонажей и разобраться кто где стоит весьма непросто. Очевидно текстовый запрос требует доработки.

Рабочая схема

2 разных девушки.
1. Кейт Денсон из dbd, full body portrait of a young country woman, long wavy blonde hair, soft natural makeup, gentle calm expression, slim fit body, wearing a dark patterned top, short denim shorts, brown leather boots
2.Юи Кимура из dbd, full body portrait of a young japanese woman, short messy dyed hair with orange tones,short messy hair, asymmetrical, slightly spiky,wearing biker goggles on her head, determined expression, athletic slim build, wearing a cropped jacket.
Ночной портрет, на фоне лес, заброшенная хижина, густой туман, искры костра, cвет луны, мистическая атмосфера, хоррор, 8k
-3
2 разных девушки.
1. Кейт Денсон из dbd, full body portrait of a young country woman, long wavy blonde hair, soft natural makeup, gentle calm expression, slim fit body, wearing a dark patterned top, short denim shorts, brown leather boots
2. Джейн Ромеро из dbd, full body portrait of a confident latina woman, curvy body, dark hair in a neat bun, warm skin tone, elegant facial features, confident expression, wearing a fitted business suit, striped pants, white blouse slightly unbuttoned, high heels.
Ночной портрет, на фоне лес, заброшенная хижина, густой туман, искры костра, cвет луны, мистическая атмосфера, хоррор, 8k
-4
3 разных девушки.
1. Кейт Денсон из dbd, full body portrait of a young country woman, long wavy blonde hair, soft natural makeup, gentle calm expression, slim fit body, wearing a dark patterned top, short denim shorts, brown leather boots
2. Джейн Ромеро из dbd, full body portrait of a confident latina woman, curvy body, dark hair in a neat bun, warm skin tone, elegant facial features, confident expression, wearing a fitted business suit, striped pants, white blouse slightly unbuttoned, high heels.
3. Юи Кимура из dbd, full body portrait of a young japanese woman, short messy dyed hair with orange tones,short messy hair, asymmetrical, slightly spiky,wearing biker goggles on her head, determined expression, athletic slim build, wearing a cropped jacket.
Ночной портрет, на фоне лес, заброшенная хижина, густой туман, искры костра, cвет луны, мистическая атмосфера, хоррор, 8k
-5

Обратите что персонажи получаются разными, близкими к канону. Вариабельность внешности проскальзывает, но не до уровня смешения. Естественно если персонажей больше двух, риски смешение элементов внешности выше.

2 разных девушки.
1. Юи Кимура из dbd, full body portrait of a young japanese woman, short messy dyed hair with orange tones,short messy hair, asymmetrical, slightly spiky,wearing biker goggles on her head, determined expression, athletic slim build, wearing a cropped jacket.
2. Джейн Ромеро из dbd, full body portrait of a confident latina woman, curvy body, dark hair in a neat bun, warm skin tone, elegant facial features, confident expression, wearing a fitted business suit, striped pants, white blouse slightly unbuttoned, high heels.
Ночной портрет, на фоне лес, заброшенная хижина, густой туман, искры костра, cвет луны, мистическая атмосфера, хоррор, 8k

Тут у нас что-то пошло не так и внешность Джейн Ромеро "уехала". Она стала скорее японской, чем латиноамериканской. Попробуем поменять девушек местами.

2 разных девушки.
1. Джейн Ромеро из dbd, full body portrait of a confident latina woman, curvy body, dark hair in a neat bun, warm skin tone, elegant facial features, confident expression, wearing a fitted business suit, striped pants, white blouse slightly unbuttoned, high heels.
2. Юи Кимура из dbd, full body portrait of a young japanese woman, short messy dyed hair with orange tones,short messy hair, asymmetrical, slightly spiky,wearing biker goggles on her head, determined expression, athletic slim build, wearing a cropped jacket.
Ночной портрет, на фоне лес, заброшенная хижина, густой туман, искры костра, cвет луны, мистическая атмосфера, хоррор, 8k

Теперь всё как надо. Как видите иногда достаточно поменять слова местами.

Описание структуры промпта

  1. Начальное предложение указывает на количество персонажей и их пол. Лучше пометить что персонажи разные чтобы нейросеть не занималась клонированием. В конце точка.
  2. Порядковый номер персонажа. Если первый описываемый персонаж, то соответственно цифра 1. Имя первого персонажа, источник т.е. из какого произведения он взят, текстовое описания внешности. Описания лучше получать обратным промптингом, когда в нейросеть загружаете референс и просите приготовить текстовый промпт.
  3. Порядковый номер, имя, источник и описания внешности второго персонажа. Если персонажей больше двух, то остальные делаются таким же шаблоном.
  4. После каждого персонажа ставим точку. Далее описываем фон, детали окружения и стиль рисовки если надо. Важно описывать в конце только окружающий мир. Детали одежды и предметы в руках героев описываются в рамках конкретного персонажа, а не в последнем абзаце.

Почему иначе всё идет не так

Многие привыкли к неплохим результатам при любом текстовом запросе. И это часто срабатывает при генерации рандомной девушки или парня в типичных условиях.

Почему такие проблемы с групповыми изображениями? Они менее популярны и их сильно меньше. Это значит что нейросеть преимущественно училась на индивидуальных портретах или рисовании безликой толпы.

Кадры с 2-3 активными персонажами ещё поискать. Поэтому у искусственного интеллекта банально не хватает насмотренности. Поэтому автору важно построить структурно понятный запрос для ИИ.

Заключение

Сегодня мы с вами научились генерации нескольких персонажей на 1 изображении. Я думаю что этот навык будет полезен для широкого круга авторов. С вами был ИндиВосток, всем хороших генераций.

#нейросети, #шедеврум, #генерацияизображений, #промпты, #обучениеШедеврум, #ИИарт, #цифровоетворчество