Найти в Дзене
ZeGame

Stable Diffusion: Знакомство с нейросетью и установка на свой компьютер

Оглавление

Здравствуйте, дорогие читатели! Сегодня мы поговорим о такой интересной и перспективной теме, как Stable Diffusion. Это новейшая нейросеть, которая способна создавать реалистичные изображения на основе текстового описания. В этой статье мы подробно разберем, что такое Stable Diffusion, как она работает и как ее установить на свой компьютер.

Stable Diffusion — это уникальная нейросетевая архитектура, которая позволяет создавать реалистичные изображения на основе текстовых описаний. В этой статье мы познакомим вас с принципами работы Stable Diffusion, а также расскажем, как установить эту нейросеть на свой компьютер.

Принцип работы Stable Diffusion

Stable Diffusion работает на основе алгоритма диффузии, который позволяет генерировать реалистичные изображения из простых текстовых описаний, таких как “изображение девушки с длинными волосами в вечернем платье”. Этот алгоритм состоит из двух основных этапов:

  1. Диффузия: на этом этапе происходит генерация изображения на основе текста. Вначале создается шумное изображение, которое затем преобразуется в изображение, соответствующее текстовому описанию.
  2. Дефлюент: на этом этапе полученное изображение улучшается и становится более реалистичным.

Установка Stable Diffusion на свой компьютер

Для установки Stable Diffusion вам потребуется следующее:

  • Компьютер с операционной системой Windows 10 или 11, обладающий 8 ГБ оперативной памяти (или более), видеокартой Nvidia 10xx (или более новой), которая имеет не менее 4 ГБ видеопамяти, и 20 ГБ свободного дискового пространства;
  • Интернет;
  • Креативность.

Я привык пользоваться автоматической установкой данной нейросети на компьютер от Сергея Потапова и Хачатура Аванесяна скачать которую можно с GitHub.

После скачивания необходимо распаковать архив и запустить скрипт webui-user-first-run.cmd. После чего начнется автоматическая установка, во время которой будет скачано примерно 20 гигабайт различных библиотек необходимых для работы нейросети.

-2

Установка занимает 10-15 минут, в зависимости от скорости вашего интернета, по окончании откроется окно интерфейса для работы с нейросетью.

-3

Краткий инструктаж по параметрам

Поля Prompt и Negative:

-4

В первое мы пишем то что мы хотим видеть на сгенерированной картинке, во второе то что мы видеть не хотим. Разработчики позаботились о нас и сами нам написали стандартный Negative который поможет нам избежать ломанной анатомии, летающих конечностей и прочих глитчей на изображении.

Количество шагов генерации:

-5

Чем больше шагов тем качественнее генерация, и тем дольше она будет проходить, чаще всего хватает 20-25 шагов.

Высота и ширина нашего изображения.

-6

Batch count и Batch size

-7

Первое отвечает за количество генераций идущих друг за другом, например нам надо 5 изображений с одним и тем же Prompt, значит ставим значение равное 5.

Второе отвечает за количество одновременных генераций. Если мы выставим count 2 и size 4 на выходе получим 2 раза по 4 изображения.

CFG Scale

-8

Данный параметр отвечает за свободу воли нейросети, на то как сильно она может отойти от нашего запроса, чем меньше параметр тем более точно будет создано изображение, рекомендуемое значение 7-9.

Практика

В целом поигравшись с этими параметрами мы уже сможем делать простые изображения например: мы хотим создать фоновое изображения для рабочего стола, из крутых тачек с кинематографичным цветом, ну и что бы был выбор скажем из 4х вариантов.

1. Составляем запрос, и переводин на английский

-9

2. Выставляем ширину и высоту картинки, у меня это FullHD - 1920х1080, делим это значение на два, что бы генерация шла быстрее и нейросеть не запуталась с большим количеством информации.

3. Пробуем так же изменять различные параметры.

4. Нажимаем кнопку "Generate".

-10

5. Если какое то изображение вам понравилось и вы хотели бы получить его в более высоком качестве, нажимаем на треугольную линейку под картинкой, что бы отправить наше изображение во вкладку Extras.

-11

6. Выбираем Upscaler(Можно попробовать разные работают они все плюс минус одинокого) и Resize - значение, на сколько будет увеличено изображение, и нажимаем Generate.

-12

Получившимся результатом уже можно и похвастаться в соцсетях перед своими друзьями.

Дальше все зависит от вашей креативности! Пробуйте, пробуйте и еще раз пробуйте!

На последок прикладываю немного изображений которые я сгенерировал, возможно они вдохновят вас:D

Мраморный человек паук
Мраморный человек паук
-14
-15
Миньон-король ночи
Миньон-король ночи

Подписывайтесь на канал, что бы не пропустить статьи с дальнейшими инструкциями, и лайфхаками по Stable Diffusion. Ставь лайк если тебе интересна эта тема и ты тоже хочешь научиться создавать крутые картинки.