В рунете уже полно гайдов по Midjourney (далее MJ) для самых маленьких и неопытных, для тех кто только знакомится с этой нейросетью. И это очень здорово.
Однако, польза от этих стартовых гайдов проходит уже после пары дней использования MJ. По настоящему методических инструкций по разным параметрам и настройкам очень мало, и то они в основном написаны несколько месяцев назад для 3 версии MJ, что сейчас не всегда актуально для версии 4.
Поэтому, я взялся за комплексное тестирование разных параметров и влияния их на результат и буду всё это оформлять в виде описания и советов с примерами. Также я буду рад замечаниям и наработкам всех причастных к нейросетевым игрищам пикабушников.
И начнем мы с предлагаемых настроек и базовых параметров. Погнали!
Настройки /settings
При вводе в любой чат с генерациями команду /settings появляется табло с текущими основными настройками, разберем каждую настройку подробнее. Вы можете нажать соответствующую кнопку настройки, и к вашему промту всегда будут добавляться параметры в виде --параметр N (два дефиса, слово, пробел, цифра). Либо можно ввести параметр вручную в конце запроса.
MJ version 1-4 (Параметр --version N или --v N) — выбор версии Midjourney. Версия 4 сейчас стоит по умолчанию и я настоятельно рекомендую пользоваться именно ей.
MJ version 1 (-- v 1) — Самый первый алгоритм работы нейросети, повезет если сгенерирует что-то внятное.
MJ version 2 (-- v 2) — Второй алгоритм, выдает абстракции, но уже больше распознавания.
MJ version 3 (-- v 3) — Третий алгоритм выглядит более художественно, но видна одна стилистика, как картина маслом. Для хороших и разнообразных работ нужны длинные и подробные промты. В этой версии работают все параметры, которые могут ещё не работать в версии 4.
MJ version 4 (-- v 4) — Последний и самый мощный алгоритм, высокая реалистичность, отчетливость деталей, достаточно описать краткий промт для эффектной генерации.
prompt: cat siting on the the sofa.
🌈 Niji Mode (-- niji) —Режим превращения своих генераций в аниме. При активации этого режима используется сторонняя нейросеть niji · journey, которая изначально обучена на анимации аниме и иллюстраций, но в таких же алгоритмах MJ. На собственном сайте niji · journey отдельная галерея работ, но у вас точно такой же аккаунт дискорда. Подписка в MJ работает и там тоже, то есть вы имеете доступ ко всем открытым работам участников. В niji journey есть даже свой собственный дискорд сервер с ботом и комьюнити, но когда этот режим добавили в настройки, им можно пользоваться в основном сервере MJ.
prompt: beautiful girl portrait, red hair, green eyes.
MJ Test (-- test) — Тестовый алгоритм для художественного стиля, походит больше на версию 3.
MJ Test Photo (-- testp) — Тестовый алгоритм для фотореалистичного стиля (чаще выходит черно-белое фото)
Если интересно, можно поиграться, но основные генерации я бы не стал тут проводить, слишком сырые алгоритмы.
prompt: portrait old man sitting on the chair.
Quality - Качество
Параметр качества --quality N или --q N показывает как точно будут обработаны детали на генерируемых изображениях. Чем выше число N тем дольше будет длиться генерация одного запроса, но детализированность изображения повысится. Это касается только первичного запроса, который дает 4 варианта, на upscale этот параметр не действует.
Half quality (--q 0.5) — Пониженное качество, быстрая пробная генерация для пробы вашего промта.
Base quality (--q 1) — Качество по умолчанию, занимает стандартное время генерации.
High quality (--q 2) —Повышенное качество, этот режим даёт наилучшие результаты детальности, занимает двойное время одной генерации.
В MJ версии --v 4 диапазон --q от 0, 25 до 5, но по факту округляется до значений 0.25, 0.5, 1 и 2. Всё что выше 2 считается как 2.
Заметил особенность работы этого параметра в версии --v 4 на момент написания статьи. Иногда разница между --q 1 и --q 2 немного заметна, иногда разницы вообще нет, как и разницы в длительности генерации. От чего это зависит я понять не смог. Так что использовать High quality пока не вижу смысла.
prompt: cat, psytrance, uhd, detailed, ornate, beautiful, 8k, photography (Мини изображения без upscale)
Style - cтилизация (для версии --v 4)
Параметр стилизации --stylize N или --s N — сложно объяснить, что он конкретно делает, в официальной документации говорится, что он отвечает за художественность изображений и подверженность стилю. По моему опыту, чем выше N, тем больше MJ добавляет «красивость», композиционную совместимость всего запроса.
Style low (--s 50) — Низкая стилизация, если вы хотите более приближенный результат к промту, без украшательств.
Style med (--s 100?) — Стилизация по умолчанию, без --s в запросе.
Style high (--s 250) — «Высокая» стилизация.
Style very high (--s 750) — «Очень высокая» стилизация.
Здесь стоит сделать комментарий. Я не случайно добавил? в Style med. На момент написания статьи, я обнаружил, что при выборе Style med по умолчанию, результат не совпадает с --s 100, он больше похож на --s 1000, и то не один в один.
Таким образом, в Midjourney --v 4 по умолчанию используется максимальная стилизация 1000, а не средняя. Добавление -- s N уменьшает стилизацию.
В MJ версии --v 3 диапазон --s от 625 до 60000 В MJ версии --v 4 диапазон --s от 0 до 1000 (однако, по факту в диапазоне 250-1000 получаются плюс минус одинаковые результаты)
prompt: corgi in space.
Upscale
Upscale — Повышение разрешения исходного изображения. Так как первичный запрос предлагает сразу 4 варианта изображения, их разрешение по умолчанию 512х512 пикселей. Вариант параметра upscale говорит как именно будет увеличено исходное изображение и до какого до размера.
Regular upscale — Стандартное повышение разрешения до 1024х1024, тип по умолчанию, который дает лучшее качество, однако, в процессе апскейла в готовую картинку могут быть случайным образом добавлены мелкие детали которых не было изначально, или могут измениться некоторые части изображения. То есть даже если апскейлить одну и ту же мини-картинку два раза подряд, вы получите разный итоговый результат.
Light upscale (--uplight) — Повышение разрешения до 1536х1536, при котором вы сохраняете исходное мини-изображение, части изображения не будут переработаны, но некая красота потеряется, мелкие детали не проработаются и могут быть шумными.
Beta upscale (--upbeta) — Повышение разрешения до 2048х2048, которое в целом похоже на light, но более «отфильтрованное»
Стоит внести комментарий. По моим наблюдениям, в версии --v 4 на данный момент параметр --uplight не работает если его вписывать вручную или выбрать кнопку в настройках. Вместо него всё равно используется Regular upscale.
Чтобы использовать Light upscale, сначала нужно апскейлить мини-изображение стандартным типом, а потом нажать кнопку Light Upscale Redo под большим изображением.
prompt: flowers on the table (Все изображения подогнаны под разрешение 1024х1024 для сравнения)
Remix mode — режим смешивания изображений
Этот режим может быть использован в 2 случаях:
Смешивание двух или нескольких разных изображений по ссылкам в одно.
Изменение запроса при выборе новых вариаций V1-V4.
Первый вариант самый известный по многочисленным мемам, он берет объект из каждого изображения и пытается создать один объект из них. В основном получается весело и забавно. Но с пользой тоже можно применять с умом. Работать с этим режимом очень просто, нужно вписать ссылки на изображения в запрос через пробел и добавить ключевые слова по необходимости. Если вы хотите добавить собственную картинку, которой нет в интернете, то можно её добавить прям в чат Дискорда и открыть через браузер - создаётся ссылка. Выглядит это так:
/imagine prompt https://s.mj.run/n_GELqgStq4 https://s.mj.run/VfqrZwej298
Имперский крейсер может как гонять повстанцев в космосе, так и погладить мантию Дарту Вейдеру.
Второй вариант использования Remix mode предполагает, что вы работаете с запросами как обычно, не обязательно с ссылками на изображения. Но всякий раз, когда вы пытаетесь создать новые вариации кнопками V1-V4 выскакивает окно, где можно изменить исходный промт, добавить или убрать слова. Новые варианты будут созданы на основании выбранного изображения с учетом нового запроса. Таким образом можно корректировать удачную генерацию, если хочется сохранить большую часть исходной.
Магическая трансформация котика в Сиба-Ину (мини изображения без upscale)
Public mode — Режим, при котором все сгенерированные изображения остаются в открытом доступе в галерее на сайте Midjourney и каждый пользователь может найти вашу работу и посмотреть какой был промт. Это режим по умолчанию и его нельзя изменить если у вас не приобретена подписка за 60$ в месяц.
Privat mode — Соответственно скрытный режим, когда ваши сгенерированные изображения недоступны для других пользователей. Приобретается только с подпиской за 60$ в месяц.
Fast и relax режимы
Fast mode — Режим быстрой генерации изображений. Каждый запрос тратит ресурс, который измеряется во времени — в часах или минутах. Этот режим расходует ваши «ограниченные» часы генерации. В среднем, один запрос тратит одну минуту этого ресурса. Приобретая подписку, вам дают определенное число быстрых часов в месяц, в этом режиме ваши запросы обрабатываются с приоритетом.
Relax mode — Режим обычной генерации изображений. В этом режиме ваши запросы начнут обрабатываться немного позже (1-10 минут), однако длительность генерации останется прежней. Этот режим доступен только в безлимитных подписках на 30$ и 60$ в месяц, и предполагается, что когда ваши fast часы закончатся, вы переходите в режим relax без ограничения по часам в оплаченном месяце.
На этом заканчиваются режимы и параметры в /settings, однако один из самых важных параметров без которого комплексная работа невозможна - это параметр соотношения сторон генерируемого изображения.
Формат изображения --ar
Параметр --ar N: N (или --aspect N: N) отвечает за соотношение сторон генерируемого изображения. По умолчанию вы получаете квадрат с параметрами --ar 1: 1, но это не показывается в промте. На данный момент в 4 версии MJ работает только 3 варианта соотношения сторон - квадрат, горизонтальное и вертикальное изображение.
Горизонтальное изображение --ar 3: 2 (на выходе получаем 1536х1024)
Вертикальное изображение --ar 2: 3 (на выходе получаем 1024х1536)
Стоит отметить, что раз размер изображения в полтора раза больше чем квадратное, то и генерируется оно немного дольше. Это требует больше ресурса ваших fast часов. MJ может по-разному располагать объекты запроса согласно выбранному формату. И это следует иметь ввиду.
В 3 версии MJ доступны более разнообразные форматы от --ar 2: 5 до 5: 2. Надеюсь, рано или поздно это будет доступно и в 4 версии.
prompt: Dart Vader in the swimming pool, 8k, photorealistic.
Итак, первая часть гайда подошла к концу. Буду рад если укажете на какие-нибудь косяки и неточности, поправлю. В следующей части разберем оставшиеся параметры и ещё чего-нибудь другого полезного)
Арты с промтами, советы по Midjourney и описание вариантов подписок в моей группе ВК.