19 подписчиков

Midjourney: настройка и генерация для самых маленьких - ч. 1

21 сентября 202321 сен 2023

7 мин

Общение с ботом происходит через команды

Чтобы вызвать список команд, нажмите / в поле ввода, прокручивайте команды, пока не найдете /settings, кликните и нажмите enter Не буду здесь подробно описывать, как получать доступ к нейросети, как оплачивать, все организационные вопросы можете оставлять в комментариях, мы с радостью на них ответим. Сегодняшняя же статья предназначена для тех, кто хотел бы точнее разобраться в настройках для получения самого удобоваримого результата. Midjourney 5 — не улучшенная версия Mj 4, а самостоятельная нейросеть с упором на имитацию реальности.

Я специально не пишу: фотореализм или фотореалистичность — потому что MJ 4 фотореалистична, а MJ 5 полноценно реалистична.

Если вы после v 4 не работали с другими версиями (почему-то), то мне очень хочется вас уберечь от разочарования: ламповость, уникальный стиль и легкое сумасшествие - этого нет в 5 версии.

Midjourney 4 версия - дикий необъезженный конь, ветер прерий. Свобода выражения, идей, интерпретаций - во

Общение с ботом происходит через команды

Midjourney 4 версия - дикий необъезженный конь, ветер прерий. Свобода выражения, идей, интерпретаций - во

Общение с ботом происходит через команды
Чтобы вызвать список команд, нажмите / в поле ввода, прокручивайте команды, пока не найдете /settings, кликните и нажмите enter

Не буду здесь подробно описывать, как получать доступ к нейросети, как оплачивать, все организационные вопросы можете оставлять в комментариях, мы с радостью на них ответим. Сегодняшняя же статья предназначена для тех, кто хотел бы точнее разобраться в настройках для получения самого удобоваримого результата.

Midjourney 5 — не улучшенная версия Mj 4, а самостоятельная нейросеть с упором на имитацию реальности.
Я специально не пишу: фотореализм или фотореалистичность — потому что MJ 4 фотореалистична, а MJ 5 полноценно реалистична.
Если вы после v 4 не работали с другими версиями (почему-то), то мне очень хочется вас уберечь от разочарования: ламповость, уникальный стиль и легкое сумасшествие - этого нет в 5 версии.
Midjourney 4 версия - дикий необъезженный конь, ветер прерий. Свобода выражения, идей, интерпретаций - возможно ВСЕ. Даже кажется, что у 4 на «фантазию» и креатив ушли все силы, их не хватает на проработку мелких деталей или скучную педантичную отрисовку рук.
5 версия - вышколенная выставочная лошадь. Умеет идеально делать то, что нужно, понимает правила и границы.
С креативом у этой версии сложнее, она ооооочень логичная, иногда слишком. 5 версия будто взвешивает: "А так бывает в реальности?" Иногда немного консервативна. И в этом мощь для творца, именно на 5 версии вы можете раскрыться и выработать свой стиль. V4 всегда впереди оператора, ее стиль во всем прослеживается.
Пройдёмся по настройкам:

1. Quality - качество. квадратиш, фантастиш, гуд.

Разницу можно заметить только между низким и базовым качеством

2. Style - настройка, которая дает «свободу самовыражения» нейронке в рамках заданного запроса.

Чем выше значение, тем более ярко проявляется стилизованность, прорисовка изображения. По умолчанию значения могут быть: 50, 100, 250, 750. Вручную для 4 версии Midjourney можно установить любые значение от 0 до 1000, чтобы задать значение Style, нужно добавить в конце запроса команду
—style (число), например, —style 1000
Зачастую, именно med дает самый стабильный и условно предсказуемый результат

3. Upscale - повышение разрешения изображения.

Сделать из 1000 пикселей 2000 пикселей непросто. Многие алгоритмы стараются дорисовать детали при увеличении картинки. Такая дорисовка
деталей часто портит изображение. Regular upscale — базовая настройка, которая работает максимально стабильно, она минимально
искажает детали при увеличении разрешения. Light и Beta — искажают мелкие детали, особенно, если на изображении есть лица и конечности. При любом виде апскейла меняется картинка.

Но только после лайт и бета апскейла для v4 появляется функция ремастер.

Функция ремастер позволяет реконструировать генерацию более старой версии через новейшую.

4. Public/Private/Remix/Fast/Relax mode

Public mode — настройка по умолчанию, доступна всем. Ваши изображения и
запросы видны всем пользователям в галерее midjourney, даже если вы их
генерируете на отдельном личном сервере.

Private mode — платный функционал, ваши изображения будут видны всем только если вы сами это разрешите в своей галерее на сайте midjourney или будете использовать Public mode.

Fast mode — настройка по умолчанию, доступнавсем. Это быстрая генерация изображений. В среднем, одна генерация занимает около 1 минуты. Быстрые часы платные и ограниченные по количеству. На подписке от 15 до 30 быстрых
часов. На подписке за 10$ доступно 200 генераций только в быстром режиме.

Relax mode — медленная генерация. Время ожидания может занимать от 1 до 15 минут, зависит от активности других пользователей. Этот мод доступен только по подписке за 30 или 60 $.

Remix mode — позволяет вносить изменения в запрос в процессе
генераций, подробнее рассмотрим на практике, чтобы было наглядно.

Многие настройки можно включить командой, минуя меню /settings
/relax - перейти в медленный режим (только платно)
/fast - перейти в быстрый режим (если остались быстрые часы)
/prefer remix - включить ремикс мод
/public - перейти в публичный режим
/private - перейти в приватный режим (только платно)

Дальше разберем ручные настройки, влияющие
на генерацию. Их нет в меню /settings, но
они крайне полезны.

Autumn landscape, Middle Ages, dragon, castle, --no people --seed 84950 --stylize 1000 --quality 2 --chaos 100 --ar 2:3 --v 4 --style 4b

Команда вводится через тире (—) или два дефиса подряд (--), дальше без пробела буква команды

—v [число] — указывается автоматически, если в меню настроек выбрана любая версия миджорни, кроме 4.
—q [число] — то же самое, что и Quality, то есть качество.
Значение по умолчанию: 1, если установлено низшее или высшее качество, то в конце запроса автоматически появится —q 0.5 и —q 2 соответственно.
Это можно указать вручную, не переключая в настройках. Если выставлено в настройках, специально вводить не нужно.
БЕСПОЛЕЗНАЯ НАСТРОЙКА ДЛЯ НОВЕЙШИХ АЛГОРИТМОВ 4 и 5
—stylize [число] — то же самое, что и stylize в меню настроек. Появится автоматически, если указана настройка не по умолчанию (не меd).
Вручную можно установить любое значение от 0 до 1000
—chaos [число] — буквально хаос, то есть насколько разными будут картинки в родительской сетке из 4 вариантов. Значения хаоса от 0 до 100, высокие значения хаоса могут дать как очень крутой, так и очень странный
результат. На то он и хаос. Я нашел для себя оптимальный диапазон от 10 до 40

—no [слово] — команда-отрицание, пропишите после —no то, чего не должно быть на картинке, можно указать через запятую несколько слов. Команду —no нейросеть понимает лучше, чем просто отрицание
no. Работает нестабильно, 100% гарантии нет, но шансы повышаются.
Такая формулировка-отрицание иначе называется «негативный промт». Неплохо работает на исключение людей, текста и лишних цветов.

—style [код] — выбор алгоритма работы 4 версии миджорни.
Мне больше всех нравится не самый новый алгоритм:—style 4b — но это чистая вкусовщина.
Еще есть —style 4а и —style 4c (—style cursed — очень плохой результат).
По умолчанию стоит —style 4c, сравним ниже все 3 алгоритма:

—ar [значение] — позволяет задать соотношение сторон отличное от базового 1:1 (квадрат). Для v 4c (версия по умолчанию) доступно 2:3 и 3:2, 9:16, 16:9, 1:2, 2:1. Влияет не только на соотношение сторон, но и на ход генерации. Некоторые объекты идеально вписываются в квадрат и плохо смотрятся в прямоугольнике.

Хотя эта дама довольно хороша и в квадрате, и в прямоугольнике, не находите?

В чем практическая польза разных форматов картинок?
1. Соответствие онлайн-площадке. Например, для инстаграма формат 1:1 уже устаревший. Актуальные форматы: 4:5 и 9:16
2. Телеграм хорошо размещает горизонтальные и квадратные форматы
3. В ВК востребованы чаще горизонтальные форматы, чуть реже - квадрат
5. Сайты/обложки/арт/мерч — индивидуально. Поэтому хорошо иметь выбор.

Пару слов о том, как рисует и «видит» нейросеть

Мы пишем текст, отправляем его нейросети. Дальше ей нужен «чистый лист», отправная точка генерации. Им выступает белый шум — как помехи на не работающем телевизоре. Если для генерации загрузить картинку-референс, то она будет выступать в роли этого «чистого листа» — набора случайного шума.

Для людей каждый набор белого шума — одинаковый. Как и два одинаковых белых листа. Но для нейросети такой шум становится опорой последующей генерации. Чтобы различать эти «листы», их надо пронумеровать. И тут появляется значение SEED (сид) — условно случайное число. Диапазон от 0 до
4294967295. Поставить больше можно, даже ошибку не покажет, но сид сбросится и выставится автоматически. И мы можем его контролировать!

—seed [любое число] — я обожаю эту настройку, она самая сложная для начального понимания и дает неочевидно полезный функционал.
Я бы назвала это «числом тестировщика». Все наглядные тесты вариантов ручных настроек в этом руководстве я провожу именно благодаря контролю —seed. Seed позволяет установить отправную точку генерации в общем хаосе (псевдо) случайных чисел. После генерации известный —seed даст повторить результат 1 в 1 для любого пользователя. Но только в том случае, если пользователь сам поделится с вами сидом своей работы. Чтобы воспроизвести генерацию, добавьте команду —seed [число] в технической части промта.
—seed есть у любой генерации, даже если вы не установили его вручную
Чтобы узнать seed в v 4 своей работы, отправьте ее себе с помощью реакции ✉ (даже если генерируете в отдельном личном чате).

Теперь вы знаете все необходимые настройки, доступные в меню /settings и те,
что можно ввести вручную! В следующем уроке продолжим оттачивать приобретённое в этой статье мастерство запросов к нейросети.

Спасибо, что прочитали эту статью полностью! Подписывайтесь на наш дзен, пересылайте друзьям, чтобы мы могли чаще радовать вас новыми материалами 😘