Stable Diffusion (SD) — мощная нейросеть, возможности которой сравнимы с Midjourney и DALL-E 2. Ее большой плюс по сравнению с конкурентами в том, что это бесплатная программа с открытым исходным кодом. Ею можно пользоваться хоть каждый день , но не более 3-5 часов в сутки. На платном тарифе время использования не ограничено.
Режим img2img ("картинка в картинке")
В SD можно не просто генерировать новые изображения, но и преобразовывать уже имеющиеся (референсные изображения). К тому же у SD есть функция Inpainting, с помощью которой можно заменить любой объект на изображении на желаемый, например, арбуз на дыню.
Во вкладке <img2img> можно загрузить понравившееся изображение, которым нейросеть будет пользоваться при генерации похожих изображений.
Режим img2img позволяет не только генерировать вариации конкретного изображения с учетом текстового запроса, но и значительно модифицировать имеющееся изображение в соответствии с запросом и "маскированием" необходимой его части.
Модификация исходного изображения
В поле слева загружается референсное изображение, которое вам нужно видоизменить. В верхней строке над ним пишется текстовый запрос на английском языке с учетом тех изменений, которые нужно произвести.
Также можно прописать и негативный запрос (то, что не хотите видеть на изображении):
Далее устанавливаются необходимые параметры, как показано на скрине красными стрелками:
Для того чтобы создать картинки, в целом похожие по стилю на исходное изображение, но все-таки отличающиеся от него, нужно установить параметр <Denoising strength> (шумоподавляющая сила) около 0,75.
Чем меньше этот параметр, тем больше будут похожи на исходное изображение создаваемые изображения. И, наоборот, чем он выше, тем вариации исходного изображения будут разнообразнее.
Коррекция лица — 1 способ
Если вас не устраивает качество полученного изображения или какая-то его часть (например, лицо), в SD предусмотрена вкладка <img2img>.
Справа под изображением есть кнопка <Send img2img>. Нажав на нее, изображение появится в левой части интерфейса. После этого нужно совершить определенные настройки, а в случае необходимости отредактировать текстовый запрос.
В этом видео я показываю один из способов коррекции лица в режиме <img2img>.
Обратите внимание на настройки, отмеченные красными стрелками:
На скрине указан сэмплер (алгоритм) DDIM, но это не обязательно. Можно поэкспериментировать с другими сэмплерами.
Параметр <Denoising strength> должен быть равным 0,2 - 0,25, чтобы генерируемое изображение не сильно отличалось от исходного — просто нужно, чтобы добавились или изменились какие-то детали на исходном изображении.
А если этот параметр установить, равным "0" — картинка никак не изменится, если "1" — получим на выходе сильно видоизмененную картинку (а это в данном случае нам не нужно).
В поле <Script> (сценарий) нужно выбрать <SD upscale>, апскейлер <ESRGAN_4k> (больше подходит для фотографий) или <R-ESRGAN 4x+> (больше подходит для картинок). Можно попробовать апскейлеры: <LDSR> и <SwinIR 4x>, но они работают медленно.
Если в результате генерации вы получите улучшенное изображение, то его можно снова улучшить, отправив на вход с помощью кнопки <Send img2img>. Эту процедуру можно проделывать многократно в случае необходимости.
В ходе этой процедуры к тому же увеличивается разрешение изображения. Также увеличить разрешение можно во вкладке <Extras>:
Коррекция лица — 2 способ ("маскирование")
Через нейросеть можно прогонять не всё изображение, а лишь ту его часть, которую нужно изменить или подправить.
Для этого под сгенерированным нейросетью изображением, расположенным справа, следует нажать кнопку <Send inpaint>, и тогда оно отобразится на входе с левой стороны. Справа от картинки нужно нажать на "кисть", установить ее размер и выделить с ее помощью черным цветом ту часть изображения, которую хотите изменить или исправить, либо, наоборот, которую хотите сохранить прежней.
То есть возможны 2 варианта:
1) указать приложению SD при генерации оставить выделенную часть неизменной и изменять все остальное;
При использовании этого варианта необходимо поставить галочку возле <inpaint not masked> — тогда редактироваться будет часть изображения, которая не выделена.
2) указать нейросети изменять только выделенную часть и не трогать всё остальное.
При использовании второго варианта необходимо поставить галочки возле <inpaint masked> (замаскированный) и <inpaint at full resolution>. Это означает, что обрабатываться будет та часть, которая закрашена.
Рекомендуется использовать сэмплер (алгоритм) DDIM.
<Denoising strength> установить на 0,75-0,8.
В результате получается картинка, идентичная исходной, кроме выделенной области (лица). Лицо после обработки стало похоже на лицо "модели", которую я указала в текстовом запросе:
Друзья, вы, наверно, догадались, что такой функционал можно использовать для редактирования любых фотографий. Но лучше всего для этой цели подходят изображения, генерируемые Stable Diffusion.
К примеру, у вас в наличии фотография, где вы в футболке и шортах. А вам нужно, чтобы вы на этой фотографии были в пиджаке c галстуком. Обычно такая замена требует много времени и навыков в Фотошопе. А благодаря нейросети Stable Diffusion, это можно сделать за несколько минут.
Как это сделать?
Загрузите фото, где вы в футболке и шортах, во вкладку img2img. Затем с помощью кисти выделите ту часть, которую хотите изменить (в данном примере - туловище). В запросе напишите "человек в костюме". Установите флажок "изменять только выделенный участок". И прогоняйте через img2img исходное изображение до тех пор, пока не получите то, что хотите.
Можно генерировать одновременно несколько изображений, из них выбрать лучшее и отправить его на вход вместо исходного изображения. Эту процедуру можно повторять до тех пор, пока вас не устроит результат.
Скорее всего придется неоднократно корректировать текстовый запрос, чтобы приблизиться к наилучшему результату.
Изображение можно потом доработать в Фотошопе за пару минут, если что-то будет не устраивать.
**********************************************************************************
P. S. Все желающие приглашаются на бесплатный мастер-класс «Специалист по нейросетям»! Вы познакомитесь с нейросетями - ChatGPT, Midjourney, Claude, YandexGPT, GigaChat, Kandinsky. Узнаете, как стать востребованным специалистом с достойным доходом. Получите ПОДАРОК — PDF-книгу «10 способов заработка на нейросетях ChatGPT и Midjourney».
<<<<< Регистрация на мастер-класс >>>>>
**********************************************************************************
✨Друзья, не пропустите вебинары, которые помогут Вам навести порядок во всех сферах жизни: