Нейросеть рисует по словам, это уже многие слышали. На моём канале я каждый день показываю рисунки из нейросети и слова, по которым они нарисованы. Но зачем в запросах на Midjourney странные буквы и цифры? Почему они всегда в конце? И что они значат? В этой статье рассмотрим самые главные из них.
Подписчик канала к статье "Как в нейросети сделать фото девушек в стиле фэнтези: описания на конкретных примерах" задал вопрос: "Что обозначают коды в "технической части"?"
В этой статье отвечаю на этот вопрос. А ссылка на статью про создание девушек-фэнтези в конце этой публикации.
Эти комбинации букв и цифр - параметры «входа» для команды. Относятся к необязательным, потому что картинка получится и без них. Но с помощью этих параметров мы можем контролировать результат. Они изменяют способ интерпретации описания (запроса) при создании изображения. Их иногда также называют «тумблерами» (switches) или «флагами» (flags).
В чём разница некоторых параметров покажу на примерах сгенерированных картинок. Статью пишу в воскресенье, поэтому тема будет "воскресно-женская".
ВАЖНО:
- Параметры всегда добавляются в конце команды. Иначе результат работы нейросети будет частично или полностью непригодной для использования.
- Параметры пишутся через разделитель "--".
Основные флаги
-- v 4
Номер используемого алгоритма. Сейчас нейросеть работает на версии 4, но часто в ленте канала вижу, как появляются генерации со старых движков. Да чего уж там, моя первая генерация была старом движке, хотя в настройках стояла версия 4. Поэтому я предпочитаю её указывать в тексте запроса.
-- ar 2:3 / -- ar 3:2
Генерирует изображения с нужным соотношением сторон. По умолчанию соотношение сторон 1:1.
Важно: --ar 16:9 / --ar 9:16 не работаю в версии 4, поэтому если вам надо получить изображение в такой пропорции, указывайте --v3
Первый запрос: кошка моет пол в гостиной, котёнок протирает пыль с полки книжного шкафа. Параметры -- ar 2:3, -- v 4
Второй запрос: Параметры -- ar 3:2, -- v 4
--hd
Использует другой, более старый алгоритм, который потенциально лучше подходит для больших изображений, но с менее последовательной композицией. Идеально подходит для абстрактных изображений и ландшафта. Указывайте в параметрах дополнительно --v 3 или --v 2.
Плюс этого параметра: генерирует изображения с более высоким разрешением без необходимости масштабирования.
--q 2 или --quality <number> , или --q <number>
Сколько времени качества рендеринга вы хотите потратить. Значение по умолчанию — 1. Более высокие значения стоят дороже, а более низкие значения стоят меньше. Под стоимостью подразумевается время (Fast Time Remaining) на генерацию изображения. Именно от этого времени зависит, сколько картинок вы можете сделать. Актуально для тех, кто на платной безлимитной подписке или если вы на обычной подписке и у вас много неизрасходованного времени. Если вы генерируете изображения в бесплатном доступе, вообще не указывайте этот параметр.
И немного о том, что описательная художественная часть имеет большое значение.
Вот такой запрос про кошку и уборку: Гуманоидная кошка моет пол в комнате, держит в руках швабру, рядом стоит ведро. Все параметры по молчанию.
И финальная версия: A cat in the form of a person, dressed in a dress, holding a mop in her hands, dancing and washing the floor in the room, full body, bright colors, watercolor --ar 3:2
Кошка в форме человека, одетая в платье, держит швабру в руках, танцует и моет пол в комнате, в полный рост, яркие цвета, акварель - ar 3:2
Надеюсь эта статья была для вас полезной! Пишите, на какие вопросы по использованию нейросети Midjourney вы хотите получить ответ! Обязательно напишу про это! И подписывайтесь на канал, чтобы не пропустить новые публикации.
Буду рада увидеть ваше "Спасибо" в комментариях - вам легко, а мне приятно и понимаю, что пишу о нейросетях не зря!