Найти тему
Пикабу

Гайд по настройкам и параметрам Midjourney v4. Часть 1

В рунете уже полно гайдов по Midjourney (далее MJ) для самых маленьких и неопытных, для тех кто только знакомится с этой нейросетью. И это очень здорово.

Однако, польза от этих стартовых гайдов проходит уже после пары дней использования MJ. По настоящему методических инструкций по разным параметрам и настройкам очень мало, и то они в основном написаны несколько месяцев назад для 3 версии MJ, что сейчас не всегда актуально для версии 4.

Поэтому, я взялся за комплексное тестирование разных параметров и влияния их на результат и буду всё это оформлять в виде описания и советов с примерами. Также я буду рад замечаниям и наработкам всех причастных к нейросетевым игрищам пикабушников.

И начнем мы с предлагаемых настроек и базовых параметров. Погнали!

Настройки /settings

При вводе в любой чат с генерациями команду /settings появляется табло с текущими основными настройками, разберем каждую настройку подробнее. Вы можете нажать соответствующую кнопку настройки, и к вашему промту всегда будут добавляться параметры в виде --параметр N (два дефиса, слово, пробел, цифра). Либо можно ввести параметр вручную в конце запроса.

.
.

MJ version 1-4 (Параметр --version N или --v N) — выбор версии Midjourney. Версия 4 сейчас стоит по умолчанию и я настоятельно рекомендую пользоваться именно ей.

MJ version 1 (-- v 1) — Самый первый алгоритм работы нейросети, повезет если сгенерирует что-то внятное.

MJ version 2 (-- v 2) — Второй алгоритм, выдает абстракции, но уже больше распознавания.

MJ version 3 (-- v 3) — Третий алгоритм выглядит более художественно, но видна одна стилистика, как картина маслом. Для хороших и разнообразных работ нужны длинные и подробные промты. В этой версии работают все параметры, которые могут ещё не работать в версии 4.

MJ version 4 (-- v 4) — Последний и самый мощный алгоритм, высокая реалистичность, отчетливость деталей, достаточно описать краткий промт для эффектной генерации.

prompt: cat siting on the the sofa.

-3

🌈 Niji Mode (-- niji) —Режим превращения своих генераций в аниме. При активации этого режима используется сторонняя нейросеть niji · journey, которая изначально обучена на анимации аниме и иллюстраций, но в таких же алгоритмах MJ. На собственном сайте niji · journey отдельная галерея работ, но у вас точно такой же аккаунт дискорда. Подписка в MJ работает и там тоже, то есть вы имеете доступ ко всем открытым работам участников. В niji journey есть даже свой собственный дискорд сервер с ботом и комьюнити, но когда этот режим добавили в настройки, им можно пользоваться в основном сервере MJ.

prompt: beautiful girl portrait, red hair, green eyes.

-4

MJ Test (-- test) — Тестовый алгоритм для художественного стиля, походит больше на версию 3.

MJ Test Photo (-- testp) — Тестовый алгоритм для фотореалистичного стиля (чаще выходит черно-белое фото)

Если интересно, можно поиграться, но основные генерации я бы не стал тут проводить, слишком сырые алгоритмы.

prompt: portrait old man sitting on the chair.

-5

Quality - Качество

Параметр качества --quality N или --q N показывает как точно будут обработаны детали на генерируемых изображениях. Чем выше число N тем дольше будет длиться генерация одного запроса, но детализированность изображения повысится. Это касается только первичного запроса, который дает 4 варианта, на upscale этот параметр не действует.

Half quality (--q 0.5) — Пониженное качество, быстрая пробная генерация для пробы вашего промта.

Base quality (--q 1) — Качество по умолчанию, занимает стандартное время генерации.

High quality (--q 2) —Повышенное качество, этот режим даёт наилучшие результаты детальности, занимает двойное время одной генерации.

В MJ версии --v 4 диапазон --q от 0, 25 до 5, но по факту округляется до значений 0.25, 0.5, 1 и 2. Всё что выше 2 считается как 2.

Заметил особенность работы этого параметра в версии --v 4 на момент написания статьи. Иногда разница между --q 1 и --q 2 немного заметна, иногда разницы вообще нет, как и разницы в длительности генерации. От чего это зависит я понять не смог. Так что использовать High quality пока не вижу смысла.

prompt: cat, psytrance, uhd, detailed, ornate, beautiful, 8k, photography (Мини изображения без upscale)

-6

Style - cтилизация (для версии --v 4)

Параметр стилизации --stylize N или --s N — сложно объяснить, что он конкретно делает, в официальной документации говорится, что он отвечает за художественность изображений и подверженность стилю. По моему опыту, чем выше N, тем больше MJ добавляет «красивость», композиционную совместимость всего запроса.

Style low (--s 50) — Низкая стилизация, если вы хотите более приближенный результат к промту, без украшательств.

Style med (--s 100?) — Стилизация по умолчанию, без --s в запросе.

Style high (--s 250) — «Высокая» стилизация.

Style very high (--s 750) — «Очень высокая» стилизация.

Здесь стоит сделать комментарий. Я не случайно добавил? в Style med. На момент написания статьи, я обнаружил, что при выборе Style med по умолчанию, результат не совпадает с --s 100, он больше похож на --s 1000, и то не один в один.

Таким образом, в Midjourney --v 4 по умолчанию используется максимальная стилизация 1000, а не средняя. Добавление -- s N уменьшает стилизацию.

В MJ версии --v 3 диапазон --s от 625 до 60000 В MJ версии --v 4 диапазон --s от 0 до 1000 (однако, по факту в диапазоне 250-1000 получаются плюс минус одинаковые результаты)

prompt: corgi in space.

-7

Upscale

Upscale — Повышение разрешения исходного изображения. Так как первичный запрос предлагает сразу 4 варианта изображения, их разрешение по умолчанию 512х512 пикселей. Вариант параметра upscale говорит как именно будет увеличено исходное изображение и до какого до размера.

Regular upscale — Стандартное повышение разрешения до 1024х1024, тип по умолчанию, который дает лучшее качество, однако, в процессе апскейла в готовую картинку могут быть случайным образом добавлены мелкие детали которых не было изначально, или могут измениться некоторые части изображения. То есть даже если апскейлить одну и ту же мини-картинку два раза подряд, вы получите разный итоговый результат.

Light upscale (--uplight) — Повышение разрешения до 1536х1536, при котором вы сохраняете исходное мини-изображение, части изображения не будут переработаны, но некая красота потеряется, мелкие детали не проработаются и могут быть шумными.

Beta upscale (--upbeta) — Повышение разрешения до 2048х2048, которое в целом похоже на light, но более «отфильтрованное»

Стоит внести комментарий. По моим наблюдениям, в версии --v 4 на данный момент параметр --uplight не работает если его вписывать вручную или выбрать кнопку в настройках. Вместо него всё равно используется Regular upscale.

Чтобы использовать Light upscale, сначала нужно апскейлить мини-изображение стандартным типом, а потом нажать кнопку Light Upscale Redo под большим изображением.

prompt: flowers on the table (Все изображения подогнаны под разрешение 1024х1024 для сравнения)

-8

Remix mode — режим смешивания изображений

Этот режим может быть использован в 2 случаях:

Смешивание двух или нескольких разных изображений по ссылкам в одно.

Изменение запроса при выборе новых вариаций V1-V4.

Первый вариант самый известный по многочисленным мемам, он берет объект из каждого изображения и пытается создать один объект из них. В основном получается весело и забавно. Но с пользой тоже можно применять с умом. Работать с этим режимом очень просто, нужно вписать ссылки на изображения в запрос через пробел и добавить ключевые слова по необходимости. Если вы хотите добавить собственную картинку, которой нет в интернете, то можно её добавить прям в чат Дискорда и открыть через браузер - создаётся ссылка. Выглядит это так:

/imagine prompt https://s.mj.run/n_GELqgStq4 https://s.mj.run/VfqrZwej298

-9

Имперский крейсер может как гонять повстанцев в космосе, так и погладить мантию Дарту Вейдеру.

Второй вариант использования Remix mode предполагает, что вы работаете с запросами как обычно, не обязательно с ссылками на изображения. Но всякий раз, когда вы пытаетесь создать новые вариации кнопками V1-V4 выскакивает окно, где можно изменить исходный промт, добавить или убрать слова. Новые варианты будут созданы на основании выбранного изображения с учетом нового запроса. Таким образом можно корректировать удачную генерацию, если хочется сохранить большую часть исходной.

-10

Магическая трансформация котика в Сиба-Ину (мини изображения без upscale)

Public mode — Режим, при котором все сгенерированные изображения остаются в открытом доступе в галерее на сайте Midjourney и каждый пользователь может найти вашу работу и посмотреть какой был промт. Это режим по умолчанию и его нельзя изменить если у вас не приобретена подписка за 60$ в месяц.

Privat mode — Соответственно скрытный режим, когда ваши сгенерированные изображения недоступны для других пользователей. Приобретается только с подпиской за 60$ в месяц.

Fast и relax режимы

Fast mode — Режим быстрой генерации изображений. Каждый запрос тратит ресурс, который измеряется во времени — в часах или минутах. Этот режим расходует ваши «ограниченные» часы генерации. В среднем, один запрос тратит одну минуту этого ресурса. Приобретая подписку, вам дают определенное число быстрых часов в месяц, в этом режиме ваши запросы обрабатываются с приоритетом.

Relax mode — Режим обычной генерации изображений. В этом режиме ваши запросы начнут обрабатываться немного позже (1-10 минут), однако длительность генерации останется прежней. Этот режим доступен только в безлимитных подписках на 30$ и 60$ в месяц, и предполагается, что когда ваши fast часы закончатся, вы переходите в режим relax без ограничения по часам в оплаченном месяце.

На этом заканчиваются режимы и параметры в /settings, однако один из самых важных параметров без которого комплексная работа невозможна - это параметр соотношения сторон генерируемого изображения.

Формат изображения --ar

Параметр --ar N: N (или --aspect N: N) отвечает за соотношение сторон генерируемого изображения. По умолчанию вы получаете квадрат с параметрами --ar 1: 1, но это не показывается в промте. На данный момент в 4 версии MJ работает только 3 варианта соотношения сторон - квадрат, горизонтальное и вертикальное изображение.

Горизонтальное изображение --ar 3: 2 (на выходе получаем 1536х1024)

Вертикальное изображение --ar 2: 3 (на выходе получаем 1024х1536)

Стоит отметить, что раз размер изображения в полтора раза больше чем квадратное, то и генерируется оно немного дольше. Это требует больше ресурса ваших fast часов. MJ может по-разному располагать объекты запроса согласно выбранному формату. И это следует иметь ввиду.

В 3 версии MJ доступны более разнообразные форматы от --ar 2: 5 до 5: 2. Надеюсь, рано или поздно это будет доступно и в 4 версии.

prompt: Dart Vader in the swimming pool, 8k, photorealistic.

-11

Итак, первая часть гайда подошла к концу. Буду рад если укажете на какие-нибудь косяки и неточности, поправлю. В следующей части разберем оставшиеся параметры и ещё чего-нибудь другого полезного)

Арты с промтами, советы по Midjourney и описание вариантов подписок в моей группе ВК.

Комментарии к посту на сайте Пикабу.