Найти в Дзене
Нейрохудожник

О современных приёмах генерации реалистичных изображений людей

Created by Flexy
Created by Flexy

Существует несколько подходов к созданию фотореалистичных изображений людей. Вот три основных:

  1. Гипердетализация (Hyperdetailism) — акцент делается на создании максимального количества деталей изображения. Если изображение не проапскейлить 8 раз и не достичь полной согласованности деталей, это будет несовместимо с ожиданиями приверженцев этого подхода.
  2. Фоторепликация (Photoreplicais) — основной фокус направлен на создание изображения, которое будет похоже на качественную фотографию. Уровень детализации здесь менее важен, так как нужно сосредоточиться на правильном освещении, выражении лица, зернистости, шуме, перспективе и других аспектах.
  3. Фейк-реальность (Fakeism) — в котором ключевым элементом является правдоподобие, поскольку основная цель — создать изображение, которое будет выглядеть как настоящая фотография человека из социальных сетей. Это означает, что не требуется сверхвысокое разрешение, тысячи деталей или даже фотографическое качество, но важно передать правильное ощущение от изображения.

Все эти подходы требуют сложного сочетания техник, различных стимулов и рабочих процессов. Каждому из них нужны совершенно разные промты, совершенно разные рабочие процессы, LoRa и т. д., чтобы добиться того, чего вы хотите, сгенерить реалистичное изображение человека.

Что же касается контрольных точек, важно помнить, что одна контрольная точка не может быть идеальной во всех трёх аспектах, и для достижения желаемого результата, генерации приемлемого изображения, или хотя бы не до конца уродливых персонажей, потребуется использование большого количества LoRa-Power. Выбирайте контрольные точки, которые считаете подходящими, и объединяйте их, пока нейронная сеть, наконец, не пойдет по пути достижения вашей генеративной цели.

Что касается LoRa, сложно определить, какие именно варианты подойдут именно вам. LoRa концепции, позы и одежды являются ключевыми элементами, так как они способствуют достижению специфичности и увеличению разнообразия. Выбор LoRa зависит от ваших целей. Можно порекомендовать NaturalBody и RetroBigNaturals для SDXL, если что, они разработаны специально для большой груди, но также могут адаптироваться и к другим формам при необходимости. Они создают красивые текстуры кожи и реалистичные формы тела. Однако работать с ними обоими одновременно сложно из-за их чувствительности к весу.

Если говорить о качестве LoRa, существует множество вариантов, поэтому сложно рекомендовать только некоторые из них. Все три лучшие модели SD (1.5, SDXL и Pony) способны создавать очень красивые и реалистичные изображения, и у каждой есть множество доступных LoRa, которые помогут в этом процессе. Если вы знаете, чего хотите, и знаете, что делаете.

Список инструментов для качественной реалистичной генерации персонажей огромен и вот некоторые из них:

  • FreeU — для тонкой настройки выборки в скрытое пространство
  • SelfAttentionGuidance — помогает создать правдоподобную среду и взаимодействие.
  • ADetailer (или другой вариант постдетализации) — для постобработки более чувствительных частей, таких как лица или руки, или просто для улучшения текстуры кожи, добавляет другую контрольную точку к вашей основной контрольной точке в случае чрезмерного срабатывания.
  • IP-Adapter, а также Instant-ID и Photomaker (поскольку все это стервозные зверюги) – эти так любимые фейкистами инструменты необходимы для обеспечения единообразия персонажей и введения конкретного лица, которое вас интересует, особенно если ваша контрольная точка дает вам только "Обычный человек № 419".
  • Regional Prompting, Multi Subject Rendering или Comfy nodes, которые позволяют вам настраивать ваш латент, и/или вводить дополнительный (для создания слоев и т. д.) — для составления изображений (чтобы избежать мема с девушкой), создания нескольких персонажей или во избежание "расползания" сюжета кадра.
  • ControlNet — обычно уже установлен, вам обязательно следует переключиться с OpenPose на DW Open Pose, поскольку он более детальный. Все любят densepose. Но DW, безусловно, выдает наиболее проработанные результаты. Вам также может понадобиться какой-нибудь модуль Poser для этого или какой-либо другой инструмент для поз, фона, глубины резкости и т.д.
  • Фоторедакторы — для завершения генерации, а также для промежуточных этапов перед отправкой изображения обратно в img2img.

Вам также понадобятся изображения-референсы. Не для персонажей (они и так хорошо создаются, если вы знаете, что делаете), а для фона и композиции изображений, которые вы считаете фотореалистичными.

#Полезное , #Техническое , #StableDiffusion