16 подписчиков

Нейросеть Stable Diffusion: обзор основных моделей, стилей и функций

1 июня 20241 июн 2024

365

9 мин

В статье рассказываю о том, как пользоваться нейросетью Stable Diffusion, делаю обзор моделей, стилей и функций, таких как: удаление ненужных обьектов и элементов, увеличение и стилизация изображений. Генерация изображений в нейросети Stable Diffusion осуществляется на основе моделей, также известных как как чекпоинты (checkpoints). Эти модели представляют собой предварительно обученные нейронные сети, которые были донастроены под конкретные темы, концепции и художественные стили. Они имеют понимание внешнего вида широкого спектра объектов, таких как люди, животные, здания и другие. Чекпоинты деляться на 2 разновидности нейросетей генеративного типа для создания изображений: 1. Группа нейросетей SDXL 2. Группа нейросетей SD 1.5 Модель SDXL x6 Является многофункциональным вариантом SDXL и предназначена для создания реалистичных портретов людей и воплощения различных художественных стилей с высоким качеством изображений.8 Модель Protovision SDXL Предназначена в основном для создания ре

Оглавление

Модель SDXL x6
Модель Protovision SDXL
Модель SDXL DeepBlue

В статье рассказываю о том, как пользоваться нейросетью Stable Diffusion, делаю обзор моделей, стилей и функций, таких как: удаление ненужных обьектов и элементов, увеличение и стилизация изображений.

Генерация изображений в нейросети Stable Diffusion осуществляется на основе моделей, также известных как как чекпоинты (checkpoints). Эти модели представляют собой предварительно обученные нейронные сети, которые были донастроены под конкретные темы, концепции и художественные стили. Они имеют понимание внешнего вида широкого спектра объектов, таких как люди, животные, здания и другие.

Чекпоинты деляться на 2 разновидности нейросетей генеративного типа для создания изображений:

1. Группа нейросетей SDXL

2. Группа нейросетей SD 1.5

Модель SDXL x6

Является многофункциональным вариантом SDXL и предназначена для создания реалистичных портретов людей и воплощения различных художественных стилей с высоким качеством изображений.8

Модель Protovision SDXL

Предназначена в основном для создания реалистичных портретов и аутентичных изображений, но также может использоваться для создания различных художественных выражений, включая создание существ, пейзажей и объектов с исключительной детализацией и качеством.

Модель SDXL DeepBlue

Выделяется своими продвинутыми возможностями создания изображений в стиле аниме, которые сочетают в себе аутентичный реализм и характерный эстетический стиль аниме. При использовании этой модели можно ожидать изображений с тщательно проработанными деталями одежды, причесок и текстур кожи.

Модель SDXL Diamond

Отлично подходит для создания премиальных аниме-иллюстраций и рекомендуется комбинировать ее с различными стилями, доступными в меню бота.

Модель SDXL Counterfeit

Сочетает в себе аутентичный аниме-стиль и художественное выражение, и каждая модель аниме создает разные результаты при использовании одинаковых инструкций.

Модель SDXL Dreamshaper

Специализируется на создании художественных и реалистичных изображений, включая детализированные портреты людей и изображения драконов и мифических существ.

Модель Juggernaut SDXL

Является одной из самых выдающихся моделей SDXL и отличается превосходной детализацией и реалистичными результатами.

В рамках нейросети Stable Diffusion 1.5 также представлены модели, такие как Reliberate, Deliberate, RPG, Dreamshaper, DarkSushi, Realistic, GhostMix, Anything и RevAminated. Каждая из этих моделей имеет свои особенности и специализацию в создании определенных эффектов и стилей.

В отличие от моделей SDXL, модели SD 1.5 являются базовой версией и работают в соответствии с определенными принципами для достижения более разнообразных результатов и ответить на вопрос: как пользоваться нейросетью Stable Diffusion.

Модель Reliberate

Предназначена для создания невероятно реалистичных изображений с вниманием к текстурам кожи, ткани и других материалов.

Модель Deliberate

Создает как художественные, так и реалистичные визуальные эффекты в зависимости от содержания заданного промпта в нейросети Stable Diffusion.

Модель RPG

Создает визуальные эффекты, напоминающие иконических персонажей из классических ролевых видеоигр, таких как Baldur's Gate, Dungeons and Dragons (DND), Icewindale и других.

Модель Dreamshaper

Предназначена для создания художественных визуальных эффектов, но также способна создавать реалистичные изображения.

Модель DarkSushi

Специализируется на создании иллюстраций в аниме-стиле, модель Realistic служит многофункциональным инструментом для создания изображений, очень похожих на фотографии, включая изображения людей, животных и различных объектов.

Модель GhostMix

Вдохновлена культовым аниме 1990-х годов и идеально подходит для создания аниме-стиля циборгов и роботов.

Модель Anything

Является основой для создания визуальных эффектов в стиле аниме, а модель RevAminated обладает разнообразным набором стилей, включая фэнтези, аниме, полу-реализм, пейзажи и другие.

Telegram-бот на примере которого я буду показывать как пользоваться нейросетью Stable Diffusion предлагает функцию выбора модели и стиля изображения для генерации изображений. В меню настроек представлены различные модели, разделенные на две группы: SDXL и SD 1.5

Нейросеть Stable Diffusion : обзор стилей

Стиль Random

Это случайный стиль, т.е. выбирается любой стиль из существующих в сервисе стиль и каждый раз это делается в случайеом порядке.

Стиль Midjourney

Это микс кинематографического и романтичного стиля, получается широкий спктр изображений от реалистичных до художественных.

Стиль Steampunk

Выделяется среди других стилей тем, что на изображении присутсвуют механические детали.

Стиль Cyberpunk

Отличается наличием на изображении светящихся деталей, походит для изображения роботов и футуристических обьектов в нейросети Stable Diffusion.

Neon Punk

Это стиль, в котором присутствуют элементы из стиля киберпанк и яркие неоновые цвета.

Стиль Anime

Применяется для создания изображений в стиле японской мультипликации.

Prime Anime

Это стиль японской анимации. Отличается яркими цветами и стилизованными персонажами.

Стиль Logo

Подходит для создания различных логотипов.

Стиль Photo

Применяется для создания реалистичных фотографий

Стиль Image

Применяется для создания различных картин и рисунков.

Стиль Cinema

Этот стиль похож на кадры из киео.

Стиль Illustration

Нужен для для создания иллюстраций в журналах и книжных изданиях.

Стиль Horror

Изображения, отражающие атмосферу ужаса.

Стиль Detailed

При прменении это стиле тщательно будут прорисованы все детали.

Стиль Space

С помощью этого стиля лучше нарисовать космисеское пространство, скафандры и тому подобеое.

Стиль Surrealism

Создание изображений с нереальными деталями, объектами.

Стиль Realism

Создает реальные реалистичные изображения.

Стиль Fantasy

Создание сказочного окружения и персонажей

Стиль Sci-Fi

Отличается добавлением источников свечения и объектов по тематике футуризма.

Стиль Dark

Изображение будет темным, как буто съемка происходила при слабом освещении.

Стиль Light

Изображения будут светлыми, как при хорошем освещении или дневном свете.

Стиль ExtraDetailed

Супердетализация в прорисовке элементов, очень тщательная прорисовка деталей.

Стиль DetailedEyes

Прорисовка глаз (основной аккцент делается на прорисовку глаз и лица)

Стиль Fantasy Art

Это создание фантастических образов и других миров.

Pixel Art

Это стиль рисования, в котором изображения создаются с использованием маленьких точек-пикселей.

Стиль 3D

Исполльзутся для создания обьемных трехмерных персонажей. Используется во всех областях, где применяется компьютерная графика.

Line Art

Это стиль изображения, основанный на рисовании линиями. Он имеет ограниченную палитру цветов или может быть черно белым.

Origami

Это мастерство моделироаания из бумаги для создания различные фигуры и объекты.

Isometric

Это стиль рисования, в котором объекты изображаются в трехмерной перспективе.

Как подключиться к нейросети Stable Diffusion?

Заходим в Телеграм-бота
Жмем "Запустить"
Активируем нажатием кнопки в порядке показанном на скриншотах "Stable Diffusion", "Настройки", "SDXL Juggernaut", "DPM++ SDM Karras", "35 steps", 1536×1024, "CFG 7", "1 копия", "DenS 0.05"
Вводим запрос (промпт) в строке "Сообщения", нажимаем на стрелку-самолетик ✈ и ждём результата генерации

Нейросеть Stable Diffusion: обзор стилей, моделей, функций

Stable Diffusion: примеры использования нейросети

Пример промпта

Женщина милая, 35 лет, средний план, анфас, красивая поза, средний рост, среднее телосложение, карие глаза, овальное лицо, легкая улыбка, красивый макияж, каштановые волнистые волосы, стильная стрижка, белая блузка с длинными рукавами, смотрит в камеру, сидит, офисное помещение, яркое дневное освещение, (на столе ноутбук), реалистичная фотография, cgi, 1024K

Сгенерируем по этому промту фотографию:

Нейросеть Stable Diffusion - как пользоваться: функии нейросети Stable Diffusion

Функция Impaint

Что делать если мы не хотим видеть какие-то элементы и объекты на изображении, а нейросеть их уже нарисовала?

Пойдем потшагам:

Нажимаем на кнопку "Опции" в нижнем меню сразу же под фото

Нейросеть Stable Diffudion: обзор функций, моделей, стилей

В следующем откывшемся меню выбираем нажатием кнопку "Impaint"

Открыть ссылку -> Открыть, и мы оказываемся на сайте
Выделяем изображение (левой кнопкой мышки на компьютере или пальцем на смартфоне)

Нейросеть Stable Diffusion: обзор моделей, стилей и функций

Нажимаем на значек корзины - это значит удалить выделенную область (в этом случае мы удаляем на заднем плане изображения людей) и нажимаем на значек дискеты - то есть сохраняем изображение.

Нейросеть Stable Diffusion - как использовать

После нажимаем на значек крестика для закрытия окна и уже измененное изображение появляется в месенджере Телеграм.

Нейросеть Stable Diffusion: обзор стилей

Если вы хотите изменить лицо на фотографии, то читайте подробнее об этом в этой статье: Нейросеть оживляет фотографии, замена лица на фото в нейросети онлайн

Как увеличить изображение и повысить качество?

Активируйте нажатием "⚙️ Настройки SD" в нижнем меню.
Устанавливаем нажатием нужное значение параметра "DenS", которое влияет на то, как сильно можно изменить оригинал (0.1 - 0.2 — оставить исходеое изображение почти неизменным, но добавить детализацию; 0.4 - 0.6 — средняя степень изменения исходного изображения с полной перерисовкой деталей; 0.7 - 1.0 — полное изменение исходного изображения)
Выбераем нажатием чекпойнт

"SDXL Juggernaut"

Активируем кнопку "Стили", выбираем стиль "Photo"
Отправьте боту изображение, которое нужно увеличить и подожите пока появится меню под изображением.
Нажмите кнопку "Детализация" в появившемся меню.

В нижнем меню под изображением есть два способа его силизации сразу вместе с его увеличением:

Это меню появляется всегда после генерации или сохранения изображения

1. Стилизация v.1 + Upscale 2X сразу с увеличением изображения

После нажатичяна кнопку "🎭 Стилизовать v.1", то бот сообщит, что стилизация будет сделана в соответствии со сделанными до этого настройками:

выбранный стиль (или несколько стилей)

допускается выбирать до трех стилей, больше нежелательно, так как это может привести к некрасивым результатам.

Исходный промпт (если вы отправили свое изображение боту с текстовой подсказкой)
значение параметра "Dens".
Выбранный чекпоинт и семплер.

Поменяем эти параметры в настройках перед стилизацией.

Нейросеть Stable Diffusion: обзор функций

И у нас получилось вот такое стилизованное изображение:

2. Стилизация v.2 + Upscale 3X с увеличением изображения в 2 раза

Метод "Стилизация v.2" отличается тем, что исходная поза, контуры и другие основные детали остаются на своих местах, а образ и окружение может измениться до неузнаваемости.

Этот метод отлично подходит для переодевания людей, для замены окружения.

Зададим новые настройки:

Нажимаем на кнопку "Настройки" в нижнем меню, и ждем пока откроется еще одно меню
Выбираем модель "SDXL DreamShaper", семплер "UniPC", "35 steps", "1 копия", "DenS 1.0"
Нажимаем на кнопку "Стили" в нижнем меню, и ждем открытия еще одного меню
Выбираем стиль "FairyTale"

Отправляем боту через скрепку 📎 наше фото и в подписи к нему пишем новый промт перед отправкой 👇

Женщина милая, 35 лет, средний план, анфас, красивая поза, средний рост, среднее телосложение, карие глаза, овальное лицо, легкая улыбка, красивый макияж, средней длины каштановые волнистые волосы, стильная стрижка, нарядное фиолетовое закрытое платье-свитере с длинными рукавами, смотрит в камеру, сидит в кафе, естественное мягкое освещение, яркие контрасты, (на столе вкусная еда), реалистичная фотография, cgi, 1024K

Затем нажимаем на кнопку "Стилизация v.2 + Upscale 3X" в нижнем меню бота и ждем результата генерации.

Вот такое стилизованое изображение получилось:

Подведем итог: Мной был сделан обзор основых моделей, стилей и функций нейросети Stable Diffusion и сделан их подробный разбор.

Надеюсь этот матерал был полезен для вас. И как всегда жду ваши лайки ❤️ и ✍️комментрии 🖐