Всем привет! Продолжаем знакомство с нейросетями для генерации картинок. Сегодня разберем еще одну условно бесплатную нейросеть под названием Dezgo.
Плюсы и минусы Dezgo
Это довольно удобная нейросеть для генерации изображений. У нее много плюсов:
- в ней не обязательно регистрироваться и вносить оплату;
- интуитивно понятный интерфейс;
- можно генерировать бесконечное количество картинок;
- есть предустановленные модификации (модели) для генерации изображений в различных стилях.
Однако, тут есть и минусы. Во-первых, в бесплатной версии за раз нельзя сгенерировать больше одной картинки - и это очень сильно бесит. Также недоступен выбор шагов для генерации изображения (для продвинутых пользователей), ограниченный вариант увеличения (апскейла) картинки. Ну, и на засыпку, в зависимости от загруженности сервера, приходится ждать пока запрос обработется от нескольких секунд до нескольких минут.
В принципе, это не слишком большие минусы. Поэтому, если вы только начинаете знакомиться с нейросетями, то это неплохой вариант более углубленного знакомства. Dezgo - немного сложнее, чем Lexica, но тоже понятна.
Разбираемся в интерфейсе
Итак, давайте познакомимся с ней поближе. Переходим на сайт нейросети по ссылке dezgo.com. Попадаем сразу в рабочий интерфейс.
1. Тут слева видим блок, где мы можем выбрать вариант генерации картинки text-to-image - означает, что нейросеть преобразовывает написанный текст в изображение. Именно этот вариант генерации самый попоулярный и открывается по умолчанию (чуть дальше разберем остальные варианты).
2. По средине большое окно Promt, где мы пишем запрос (исключительно на английском языке).
3. Зеленая кнопка Run - ее нажимаем, чтобы сгенерировать картинку, после того, как описали то, что хотим увидеть.
4. Слева в блоке еще есть вариант меню image-to-image. Это еще один вариант генерации изображений. При этом вы для нейросети загружаете исходную картинку-образец, а она ее перерисовывает.
5. Меню Upscale - позволяет повысить/улучшить качество вашего изображения.
Также ниже есть еще один вариант в тестовом режиме Text-to-video. Не трудно догадаться, что по вашему описанию нейросеть попробует создать видео.
Если мы посмотрим на центр рабочего интерфейса, то увидим еще 2 выпадающих списка.
Первый список Model. Тут можно выбрать модель нейросети. В зависимости от этого нейросеть будет генерировать разные изображения от аниме и рисованных картинок до фотореалистичных изображений. Тут выбор зависит только от вашей задумки.
Далее раскрываем вкладку More options и разбираемся по порядку:
1. Resolution - дословно "разрешение", но на деле это ориентация картинки. Перемещая ползунок, вы меняете картинку с вертикальной на гоизонтальную. По умолчанию плзунок стоит посредине шкалы - это квадратное изображение.
2. Negative promt - негативный запрос. То, что вы не хотели бы видеть на своем изображении. По умолчанию тут уже прописаны самые популярные антизапросы, такие как плохо прорисованные руки, ноги, лицо, плохая анатомия, текст и пр. Это очень удобно. От себя тоже что-то можете добавить, если будет нужно.
3. Guidance - то, насколько сильно нейросеть будет следовать вашему запросу. Этот параметр лучше не трогать вообще, он выведен опытным путем.
4. Sampler - метод, который используется для генерации изображения. На выбор предлагается 4 сэмплера. Все они работают немного по разному в отношении фотографичных и рисованых изображений. Более менее универсальным будет Euler Ancestral.
5. Seed - номер шума. Он случайный, это окно оставляем пустым.
6. Steps - количество шагов, которое делает нейросеть для генерации изображения (доступно в платной версии Power mode).
7. Upscale - автоматическое улучшение и увеличение сгенерированного изображения в 2 раза (доступно в платной версии Power mode).
Поработаем с нейросетью
Пишем в окне Promt простенький запрос. Мне хочется фото цветущей сакуры на закате - cherry blossoms at sunset, highly detailed, realistic photography. Выбираем модель: я хочу фотографичное изображение, ставлю модель Stable Diffusion 2.1. Негативный запрос уже есть, поэтому нажимаю кнопку Run.
Поскольку эта нейросеть выдает за раз только одно изображение, то пришлось несколько раз нажимать кнопку Run, пока не появилась более менее подходящее изображение.
Кстати, если вам какая-то картинка нравится или вы сомневаетесь, то лучше сохраните ее с помощью кнопки Download под изображением. В этой нейросети нет возможности просмотреть то, что вы сделали ранее (и это тоже минус). Позже в запрос добавила словосочетание close up, чтоб получались более приближенные к нам изображения.
Спустя энное количество не самых удачных попыток, у меня получилось нечто похожее на то, чего я хотела добиться. Сохраняем эту картинку и работаем с ней дальше.
Переходим в левом меню во вкладку меню image-to-image.
1. Загружаем сохраненное изображение, кликом по пустому месту в поле Init Image. Сюда можно загрузить любое фото/картинку, которое хотите перерисовать.
2. Пишем запрос, что мы хотим видеть.
3. Ползунок Strength - отвечает за то, насколько сильно нейросеть изменит исходное изображение. Если не хотите сильно менять ставьте 20-30%. Чем больше значение поставите, тем больше нейросеть будет "фантазировать от себя".
4. Тут опять таки можно поменять модель.
5. Нажимаем Run.
Я загружаю свою картинку, меняю модель и на выходе получаю улучшенное изображение. Оно более детализированное. Снова его сохраняю и теперь нам нужно его увеличить и сделать более качественным.
Переходим во вкладку Upscale, загружаем нашу сакуру и нажимаем Run.
Вот и все! Картинка готова, можно ее загружать в соцсети и хвастаться. На мой взгляд, все очень просто и доступно для понимания.
Dezgo - это неплохая нейросеть, чтобы поучиться новичку. Но она медлительная и не всегда выдает то, что тебе нужно. Однако попрактиковаться в ней однозначно стоит для того, чтоб лучше понимать, как это работает. Плюс нет ограничений на количество сгенерированных картинок. Так что дерзайте и делитесь в комментариях своими впечатлениями!
PS: На каждую статью с гайдом и разбром уходит уйма времени. Поэтому, пожалуйста, поставьте лайк и напишите "Спасибо", если информация была вам полезной. Это дает мне понимание, что мои старания не напрасны и стимулирует писать больше.