В статье рассказываю о том, как пользоваться нейросетью Stable Diffusion, делаю обзор моделей, стилей и функций, таких как: удаление ненужных обьектов и элементов, увеличение и стилизация изображений.
Генерация изображений в нейросети Stable Diffusion осуществляется на основе моделей, также известных как как чекпоинты (checkpoints). Эти модели представляют собой предварительно обученные нейронные сети, которые были донастроены под конкретные темы, концепции и художественные стили. Они имеют понимание внешнего вида широкого спектра объектов, таких как люди, животные, здания и другие.
Чекпоинты деляться на 2 разновидности нейросетей генеративного типа для создания изображений:
1. Группа нейросетей SDXL
2. Группа нейросетей SD 1.5
Модель SDXL x6
Является многофункциональным вариантом SDXL и предназначена для создания реалистичных портретов людей и воплощения различных художественных стилей с высоким качеством изображений.8
Модель Protovision SDXL
Предназначена в основном для создания реалистичных портретов и аутентичных изображений, но также может использоваться для создания различных художественных выражений, включая создание существ, пейзажей и объектов с исключительной детализацией и качеством.
Модель SDXL DeepBlue
Выделяется своими продвинутыми возможностями создания изображений в стиле аниме, которые сочетают в себе аутентичный реализм и характерный эстетический стиль аниме. При использовании этой модели можно ожидать изображений с тщательно проработанными деталями одежды, причесок и текстур кожи.
Модель SDXL Diamond
Отлично подходит для создания премиальных аниме-иллюстраций и рекомендуется комбинировать ее с различными стилями, доступными в меню бота.
Модель SDXL Counterfeit
Сочетает в себе аутентичный аниме-стиль и художественное выражение, и каждая модель аниме создает разные результаты при использовании одинаковых инструкций.
Модель SDXL Dreamshaper
Специализируется на создании художественных и реалистичных изображений, включая детализированные портреты людей и изображения драконов и мифических существ.
Модель Juggernaut SDXL
Является одной из самых выдающихся моделей SDXL и отличается превосходной детализацией и реалистичными результатами.
В рамках нейросети Stable Diffusion 1.5 также представлены модели, такие как Reliberate, Deliberate, RPG, Dreamshaper, DarkSushi, Realistic, GhostMix, Anything и RevAminated. Каждая из этих моделей имеет свои особенности и специализацию в создании определенных эффектов и стилей.
В отличие от моделей SDXL, модели SD 1.5 являются базовой версией и работают в соответствии с определенными принципами для достижения более разнообразных результатов и ответить на вопрос: как пользоваться нейросетью Stable Diffusion.
Модель Reliberate
Предназначена для создания невероятно реалистичных изображений с вниманием к текстурам кожи, ткани и других материалов.
Модель Deliberate
Создает как художественные, так и реалистичные визуальные эффекты в зависимости от содержания заданного промпта в нейросети Stable Diffusion.
Модель RPG
Создает визуальные эффекты, напоминающие иконических персонажей из классических ролевых видеоигр, таких как Baldur's Gate, Dungeons and Dragons (DND), Icewindale и других.
Модель Dreamshaper
Предназначена для создания художественных визуальных эффектов, но также способна создавать реалистичные изображения.
Модель DarkSushi
Специализируется на создании иллюстраций в аниме-стиле, модель Realistic служит многофункциональным инструментом для создания изображений, очень похожих на фотографии, включая изображения людей, животных и различных объектов.
Модель GhostMix
Вдохновлена культовым аниме 1990-х годов и идеально подходит для создания аниме-стиля циборгов и роботов.
Модель Anything
Является основой для создания визуальных эффектов в стиле аниме, а модель RevAminated обладает разнообразным набором стилей, включая фэнтези, аниме, полу-реализм, пейзажи и другие.
Telegram-бот на примере которого я буду показывать как пользоваться нейросетью Stable Diffusion предлагает функцию выбора модели и стиля изображения для генерации изображений. В меню настроек представлены различные модели, разделенные на две группы: SDXL и SD 1.5
Нейросеть Stable Diffusion : обзор стилей
Стиль Random
Это случайный стиль, т.е. выбирается любой стиль из существующих в сервисе стиль и каждый раз это делается в случайеом порядке.
Стиль Midjourney
Это микс кинематографического и романтичного стиля, получается широкий спктр изображений от реалистичных до художественных.
Стиль Steampunk
Выделяется среди других стилей тем, что на изображении присутсвуют механические детали.
Стиль Cyberpunk
Отличается наличием на изображении светящихся деталей, походит для изображения роботов и футуристических обьектов в нейросети Stable Diffusion.
Neon Punk
Это стиль, в котором присутствуют элементы из стиля киберпанк и яркие неоновые цвета.
Стиль Anime
Применяется для создания изображений в стиле японской мультипликации.
Prime Anime
Это стиль японской анимации. Отличается яркими цветами и стилизованными персонажами.
Стиль Logo
Подходит для создания различных логотипов.
Стиль Photo
Применяется для создания реалистичных фотографий
Стиль Image
Применяется для создания различных картин и рисунков.
Стиль Cinema
Этот стиль похож на кадры из киео.
Стиль Illustration
Нужен для для создания иллюстраций в журналах и книжных изданиях.
Стиль Horror
Изображения, отражающие атмосферу ужаса.
Стиль Detailed
При прменении это стиле тщательно будут прорисованы все детали.
Стиль Space
С помощью этого стиля лучше нарисовать космисеское пространство, скафандры и тому подобеое.
Стиль Surrealism
Создание изображений с нереальными деталями, объектами.
Стиль Realism
Создает реальные реалистичные изображения.
Стиль Fantasy
Создание сказочного окружения и персонажей
Стиль Sci-Fi
Отличается добавлением источников свечения и объектов по тематике футуризма.
Стиль Dark
Изображение будет темным, как буто съемка происходила при слабом освещении.
Стиль Light
Изображения будут светлыми, как при хорошем освещении или дневном свете.
Стиль ExtraDetailed
Супердетализация в прорисовке элементов, очень тщательная прорисовка деталей.
Стиль DetailedEyes
Прорисовка глаз (основной аккцент делается на прорисовку глаз и лица)
Стиль Fantasy Art
Это создание фантастических образов и других миров.
Pixel Art
Это стиль рисования, в котором изображения создаются с использованием маленьких точек-пикселей.
Стиль 3D
Исполльзутся для создания обьемных трехмерных персонажей. Используется во всех областях, где применяется компьютерная графика.
Line Art
Это стиль изображения, основанный на рисовании линиями. Он имеет ограниченную палитру цветов или может быть черно белым.
Origami
Это мастерство моделироаания из бумаги для создания различные фигуры и объекты.
Isometric
Это стиль рисования, в котором объекты изображаются в трехмерной перспективе.
Как подключиться к нейросети Stable Diffusion?
- Заходим в Телеграм-бота
- Жмем "Запустить"
- Активируем нажатием кнопки в порядке показанном на скриншотах "Stable Diffusion", "Настройки", "SDXL Juggernaut", "DPM++ SDM Karras", "35 steps", 1536×1024, "CFG 7", "1 копия", "DenS 0.05"
- Вводим запрос (промпт) в строке "Сообщения", нажимаем на стрелку-самолетик ✈ и ждём результата генерации
Stable Diffusion: примеры использования нейросети
Пример промпта
Женщина милая, 35 лет, средний план, анфас, красивая поза, средний рост, среднее телосложение, карие глаза, овальное лицо, легкая улыбка, красивый макияж, каштановые волнистые волосы, стильная стрижка, белая блузка с длинными рукавами, смотрит в камеру, сидит, офисное помещение, яркое дневное освещение, (на столе ноутбук), реалистичная фотография, cgi, 1024K
Сгенерируем по этому промту фотографию:
Нейросеть Stable Diffusion - как пользоваться: функии нейросети Stable Diffusion
Функция Impaint
Что делать если мы не хотим видеть какие-то элементы и объекты на изображении, а нейросеть их уже нарисовала?
Пойдем потшагам:
- Нажимаем на кнопку "Опции" в нижнем меню сразу же под фото
- В следующем откывшемся меню выбираем нажатием кнопку "Impaint"
- Открыть ссылку -> Открыть, и мы оказываемся на сайте
- Выделяем изображение (левой кнопкой мышки на компьютере или пальцем на смартфоне)
- Нажимаем на значек корзины - это значит удалить выделенную область (в этом случае мы удаляем на заднем плане изображения людей) и нажимаем на значек дискеты - то есть сохраняем изображение.
- После нажимаем на значек крестика для закрытия окна и уже измененное изображение появляется в месенджере Телеграм.
- Если вы хотите изменить лицо на фотографии, то читайте подробнее об этом в этой статье: Нейросеть оживляет фотографии, замена лица на фото в нейросети онлайн
Как увеличить изображение и повысить качество?
- Активируйте нажатием "⚙️ Настройки SD" в нижнем меню.
- Устанавливаем нажатием нужное значение параметра "DenS", которое влияет на то, как сильно можно изменить оригинал (0.1 - 0.2 — оставить исходеое изображение почти неизменным, но добавить детализацию; 0.4 - 0.6 — средняя степень изменения исходного изображения с полной перерисовкой деталей; 0.7 - 1.0 — полное изменение исходного изображения)
- Выбераем нажатием чекпойнт
"SDXL Juggernaut"
- Активируем кнопку "Стили", выбираем стиль "Photo"
- Отправьте боту изображение, которое нужно увеличить и подожите пока появится меню под изображением.
- Нажмите кнопку "Детализация" в появившемся меню.
В нижнем меню под изображением есть два способа его силизации сразу вместе с его увеличением:
Это меню появляется всегда после генерации или сохранения изображения
1. Стилизация v.1 + Upscale 2X сразу с увеличением изображения
После нажатичяна кнопку "🎭 Стилизовать v.1", то бот сообщит, что стилизация будет сделана в соответствии со сделанными до этого настройками:
- выбранный стиль (или несколько стилей)
допускается выбирать до трех стилей, больше нежелательно, так как это может привести к некрасивым результатам.
- Исходный промпт (если вы отправили свое изображение боту с текстовой подсказкой)
- значение параметра "Dens".
- Выбранный чекпоинт и семплер.
Поменяем эти параметры в настройках перед стилизацией.
И у нас получилось вот такое стилизованное изображение:
2. Стилизация v.2 + Upscale 3X с увеличением изображения в 2 раза
Метод "Стилизация v.2" отличается тем, что исходная поза, контуры и другие основные детали остаются на своих местах, а образ и окружение может измениться до неузнаваемости.
Этот метод отлично подходит для переодевания людей, для замены окружения.
Зададим новые настройки:
- Нажимаем на кнопку "Настройки" в нижнем меню, и ждем пока откроется еще одно меню
- Выбираем модель "SDXL DreamShaper", семплер "UniPC", "35 steps", "1 копия", "DenS 1.0"
- Нажимаем на кнопку "Стили" в нижнем меню, и ждем открытия еще одного меню
- Выбираем стиль "FairyTale"
Отправляем боту через скрепку 📎 наше фото и в подписи к нему пишем новый промт перед отправкой 👇
Женщина милая, 35 лет, средний план, анфас, красивая поза, средний рост, среднее телосложение, карие глаза, овальное лицо, легкая улыбка, красивый макияж, средней длины каштановые волнистые волосы, стильная стрижка, нарядное фиолетовое закрытое платье-свитере с длинными рукавами, смотрит в камеру, сидит в кафе, естественное мягкое освещение, яркие контрасты, (на столе вкусная еда), реалистичная фотография, cgi, 1024K
- Затем нажимаем на кнопку "Стилизация v.2 + Upscale 3X" в нижнем меню бота и ждем результата генерации.
Вот такое стилизованое изображение получилось:
Подведем итог: Мной был сделан обзор основых моделей, стилей и функций нейросети Stable Diffusion и сделан их подробный разбор.
Надеюсь этот матерал был полезен для вас. И как всегда жду ваши лайки ❤️ и ✍️комментрии 🖐