Найти тему
Neuro-сеть

Как запустить нейросеть Stable Diffusion 3 Medium за 10 минут. Бесплатно🤑

Оглавление

Приветствую!

Давно не писал гайды, но самый простой способ (онлайн) воспользоваться новейшей моделью SD3M в моём прошлом посте:

Это руководство по установке и использованию модели нейросети Stable Diffusion 3 Medium (SD3M) с интерфейсом SwarmUI. Вы узнаете, как зарегистрироваться на Hugging Face, скачать и установить модель SD3M, и использовать её для генерации изображений.

Подготовка

Для начала вам нужно получить эти самые модели на Huggingface. Я выделю жёлтым скачиваемые файлы и куда нужно нажимать

Переходим по этой ссылке:

stabilityai/stable-diffusion-3-medium · Hugging Face

Но для того чтобы скачать, сперва нужно зарегистрироваться или войти в аккаунт. Нажмите Log In:

Нажимаем Log in
Нажимаем Log in

Если у вас есть аккаунт на Huggingface войдите в него:

Тут нужно ввести вашу эл. почту и пароль к аккаунту, если у вас есть аккаунт
Тут нужно ввести вашу эл. почту и пароль к аккаунту, если у вас есть аккаунт

Но если нет аккаунта нужно его создать, нажав на кнопку Sign Up:

Введите вашу эл. почту и придумать пароль к новому аккаунту
Введите вашу эл. почту и придумать пароль к новому аккаунту

Придумайте и заполните свой ник в поле Username, внизу галочку и аккаунт создастся кнопкой Create account (возможна проверка каптчой):

Страница регистрации нового аккаунта
Страница регистрации нового аккаунта

Вас переадресует на страницу где нужно еще раз ввести данные. В графе Organization желательно указать несуществующую компанию. Внизу галочка и нажмите на кнопку Agree access repository:

Дополнительная страница регистрации
Дополнительная страница регистрации

Всё, теперь когда вы создали аккаунт или вошли в существующий вам нужно перейти во вкладку Files на странице SD3Medium:

Вкладка Files
Вкладка Files

Скачайте модель sd3_medium_safetensors.

Теперь у нас есть модель и можно скачивать для неё обёртку, которая позволит воспользоваться этой нейросетью.

Есть два способа: SwarmUI и ComfUI. Я выбрал SwarmUI т.к. он более прост в использовании и установке. К тому же ComfUI не всем удобен интерфейс с нодами и связями.

SwarmUI включает в себя ComfUI как бэкэнд, который реализует использование всех прелестей нейросетей. По сути это просто удобный интерфейс.

Скачать отсюда:

GitHub - Stability-AI/StableSwarmUI: StableSwarmUI, A Modular Stable Diffusion Web-User-Interface, with an emphasis on making powertools easily accessible, high performance, and extensibility.

Немного листаем вниз и там будет мини-гайд по установке. Если вкратце то сначала нужно установить GIT и DotNET 8. Вы можете это сделать вручную, в ином случае на стадии установки SwarmUI это всё загрузится и установится автоматически.

Потом вы скачиваете файл инсталляции SwarmUI в виде .bat файла. Этот файл нужно поместить в папку на диске, где вы предполагаете размещение всех моделей и нейросетей (нельзя указывать папку на диске C:\Program Files)
Я выделил желтым цветом, что нужно скачать и установить:

Страница загрузки SwarmUI
Страница загрузки SwarmUI

Установка

Итак, вы положили файл install-windows.bat в папку на диске, например, E:\SwarmUI
Далее нужно его запустить, и вы увидите начало загрузки и установки SwarmUI:

Загрузка займет время
Загрузка займет время

Через некоторое время установка закончится и SwarmUI откроется автоматически в вашем браузере:

Вот так выглядит интерфейс
Вот так выглядит интерфейс

Ранее вы скачали модель StableDiffusion 3 Medium и теперь нужно её переместить в папку Models\Stable-Diffusion, например, у меня путь выглядит так:

E:\Stableswarm\StableSwarmUI\Models\Stable-Diffusion

Положите в эту папку скачанную модель
Положите в эту папку скачанную модель

Теперь переходим в браузер и там нужно обновить список наших моделей и выбрать нужную:

Победа!
Победа!

В целом на этом установка всё. Расскажу немного о пользовании:

Панель генерации изображений
Панель генерации изображений

Слева у вас есть панель с настройками. Я рекомендую выставить значения:

Steps - 30 или 40.

CFG Scale - 4 для фотореалистичности, чем больше тем больше нейросеть галлюцинирует.

Aspect Ratio - выберите параметр Custom и выставляйте нужные значение. Помните, что чем больше разрешение тем больше нагрузка на видеокарту и соответственно дольше генерация.

Sampler - лично мне нравится DPMPP_2m (в других оболочках называется DPM++2M).

Sheduler - параметр sgm_uniform мне больше всего понравился

SD3 TextEncs - это параметр, который регулирует текст на изображении. Есть энкодеры CLIP, T5, CLIP+T5. CLIP метод рабочий, но не лучше T5:

Попросил написать снизу SD3M
Попросил написать снизу SD3M

Чтобы скачать текстовый энкодер T5 нужно опять перейти на Huggingface во вкладку Files и открыть папку text_encoders:

-14

Скачайте эти файлы:

-15

Поместите эти два файла в папку по пути:

\StableSwarm\Models\clip. У меня это E:\stableswarm\StableSwarmUI\Models\clip

-16

Перезапустите SwarmUI. Теперь когда вы выберете параметр T5 консоль начнёт скачиваете дополнительных файлов (да да, нейросети занимают много места):

-17
-18

После всех скачиваний и установок изображение сгенерируется и вы увидите результат получше. Но к сожалению я не могу показать различия т.к. моих 16 Гб ОЗУ не хватило :)

Обратите внимание на нижнюю панель после генерации:

-19

Edit Image - тут можно редактировать изображение и рисовать маску для повторной генерации.

Upscale2x - увеличение разрешения картинки и улучшение детализации

Star - пометить изображение

Reuse Parameters - применить параметры этого изображения в панель слева

More - тут можно удалить или скачать изображение, а ещё отобразить его в папке

Вот примеры моих запросов:

Спасибо, что дочитали до конца! 🙏

Буду рад вашим комментариям🎤, лайкам🧡 и подпискам на мой канал:

Neuro-сеть | Дзен

Так же заходите в мою группу в VK и на канал Телеграм.

Вам может понравится:

#Нейросети #Stable Diffusion #SD3M #Hugging Face #Установка программ #Машинное обучение #Искусственный интеллект #Технологические руководства #SwarmUI #ComfUI #Генерация изображений #Загрузка моделей #GIT #DotNET 8 #Установка ПО