Найти в Дзене
Никита Титов

Искусство создания идеальных портретов в Midjourney: мастерство генерации изображений, неразличимых от реальных фотографий

Обучение искусству цифровой фотографии с использованием нейросетей.

В марте социальные сети оживились от ИИ-созданных изображений, поразительно похожих на настоящие фотографии.

2022 год ознаменовался прорывом в области искусственного интеллекта, с нейросетями, создающими художественные произведения наравне с человеческим мастерством. Но 2023 год открыл новую эру в фотореализме: Midjourney v5 подняла планку, достигнув поразительного качества в визуализации. Теперь сложно уловить различия между ИИ-снимками и реальными фотографиями, ведь прежние недостатки, такие как неправильно расположенные глаза или лишние пальцы, устранены.

Среди ярких примеров - изображение Папы Римского в пуховике от Balenciaga, выдуманное свидание Илона Маска с Александрой Окасио-Кортес и фиктивное землетрясение в Канаде 2002 года, которые многие приняли за реальность. Это вызвало волну внимания к Midjourney, в результате чего разработчики ввели ограничения на некоторые запросы. Однако фотореализм, созданный с помощью нейросетей, похоже, останется с нами на долгое время.

Мы расскажем, как создавать искусственные, но удивительно реалистичные фотографии и портреты знаменитостей.

Почему Midjourney v5 достигает такого уровня реализма

До пятой версии, Midjourney фокусировалась в основном на обучении своей нейросети создавать иллюстрации, что приводило к генерации артов из стандартных запросов. Но пользователи находили способы адаптировать эту технологию для создания фотоподобных изображений.

В версии 5, ключевым улучшением стал именно аспект фотореализма, позволяющий получать изображения, стремительно приближенные к реальным снимкам. Несмотря на то, что v5 все еще находится на стадии альфа-тестирования, она уже демонстрирует поразительные результаты.

Фотореализм стал стандартом в Midjourney v5. Ранее, чтобы создать в Midjourney что-то похожее на фотографию, требовалось вводить множество дополнительных параметров – тип камеры, жанр съемки, даже имя известного фотографа. Теперь же, Midjourney v5 способна автоматически генерировать изображения с идеальным освещением, выразительными позами и яркими цветами, напоминающие профессионально ретушированные снимки знаменитостей и моделей.

«elderly woman» – версия v4
«elderly woman» – версия v4
«elderly woman» – версия v5
«elderly woman» – версия v5
  • Улучшенное качество изображений в Midjourney v5. В сравнении с предыдущей версией, v5 удваивает разрешение изображений, что значительно улучшает их качество.
  • Проработанная детализация. В версии 5, типичные проблемы искусственного интеллекта, такие как неправильное количество пальцев, несоответствующий взгляд глаз или неверное количество зубов, были устранены. Благодаря улучшенным деталям, генерация лиц стала значительно более точной.
  • Улучшенное воспроизведение нескольких людей на одном изображении. В предыдущих версиях нейросеть испытывала трудности с созданием изображений, где присутствует несколько человек. Теперь, хотя некоторые «артефакты» все еще присутствуют, они стали менее заметными и чаще встречаются на второстепенных планах.

«the man shows the ok gesture» - v4
«the man shows the ok gesture» - v4
«the man shows the ok gesture» - v5
«the man shows the ok gesture» - v5

Создание реалистичных изображений людей в Midjourney

Для ознакомления с основами использования Midjourneyи составления базовых запросов, рекомендуем прочитать наше руководство. В этой статье мы сосредоточимся на конкретной задаче: как формулировать промпты для создания реалистичных изображений в пятой версии нейросети. Чтобы добиться оптимальных результатов, не забудьте активировать версию 5, добавив команду

--v5 к вашему запросу или через настройки программы.

Формулировка запросов на английском языке

Поскольку нейросети Midjourney были обучены на парах «изображение-описание» на английском языке, они лучше всего реагируют на запросы, сформулированные на этом языке. Хотя нейросети могут интерпретировать и другие языки, включая эмодзи, результаты на них могут быть менее предсказуемыми. Если вы не владеете английским, рекомендуем использовать нейросетевой переводчик DeepL для перевода, так как он лучше учитывает контекст, чем Google Translate.

Чем более детализирован ваш запрос, тем точнее будут результаты. Поэтому запросы для создания фотографии обычно бывают довольно объемными.

Каждое слово в вашем запросе имеет свое значение и определяет различные параметры. Мой запрос структурирован следующим образом: стиль — персонаж — камера — освещение — композиция кадра — атмосфера — локация — дополнительные детали — соотношение сторон. Давайте подробно разберем каждый из этих параметров.

Разбор промта

portrait (стиль фотосессии) of a man with blond hair (объект) in a black coat (во что одет) smoking a cigar (действие),Tri-X400 (на какой фотоаппарат снят кадр), natural light (свет), close-up (план), cafe in Amsterdam (локация), lots of people (дополнительная деталь)--ar4:3

Результат работы
Результат работы

Выбор стиля в Midjourney

По умолчанию Midjourney создает изображения в фотореалистичном стиле. Однако, если ваш запрос выходит за рамки реальности, например, включает мистические существа, нейросеть может переключиться на иллюстративный стиль или создание концепт-арта.

Для гарантии генерации фотореализма, рекомендуется добавлять в начале запроса слово 'photo'. Но имейте в виду, что такой запрос может привести к более простым и менее увлекательным результатам, часто портретным снимкам на черном фоне. Чтобы сделать изображение более интересным, определите конкретный стиль фотографии, например, 'street style photo', 'editorial photo', 'fashion photo', 'portrait photo' для создания уличных снимков, фотографий для журналов, модных изображений или портретов.

Для создания исторического фото, укажите желаемую эпоху, например, '1980s street style photo'. Это повлияет не только на атмосферу снимка, но и на одежду модели. Без этого уточнения Midjourney сгенерирует снимок в современном стиле.

Street style photo of a girl with dark hair in a white tank top walking,Kodak Gold 200, natural light, medium plan, New York, earrings, --ar 4:3
Street style photo of a girl with dark hair in a white tank top walking,Kodak Gold 200, natural light, medium plan, New York, earrings, --ar 4:3
Fashion photo of a blonde girl in classic clothes in a palace, Fujifilm Pro 400H, natural light, medium plan, gloves -ar 4:3
Fashion photo of a blonde girl in classic clothes in a palace, Fujifilm Pro 400H, natural light, medium plan, gloves -ar 4:3
Fashion photo of a girl with freckles with dark hair and brown eyes, Hasselblad X1, artificial lighting, close-up, white top, powder pants, --ar 4:3
Fashion photo of a girl with freckles with dark hair and brown eyes, Hasselblad X1, artificial lighting, close-up, white top, powder pants, --ar 4:3
photo from the 80s of a woman in a fur hat at the train station, Kodak Ektar, natural light, medium plan, carrying a bag --ar 4:3
photo from the 80s of a woman in a fur hat at the train station, Kodak Ektar, natural light, medium plan, carrying a bag --ar 4:3
photo from the 60s of a hippie girl with a cigarette in New York, Kodak Ektar, natural light, medium plan, glasses --ar 4:3
photo from the 60s of a hippie girl with a cigarette in New York, Kodak Ektar, natural light, medium plan, glasses --ar 4:3

Определение персонажа в запросе

Персонаж является ключевым элементом любого запроса в Midjourney. Если вы укажете просто 'мужчина' или 'женщина' без дополнительных характеристик, нейросеть сгенерирует случайный образ. Это удобно, когда вы еще не определились с конкретным образом и ищете вдохновение.

Однако, если вы добавите конкретные детали, такие как черты лица, цвет волос, этническую принадлежность, стиль одежды и аксессуары, Midjourneyпопытается воссоздать все эти элементы. Вы можете описать модель очень детально, вплоть до цвета глаз и выражения лица. Если какой-то детали вы хотите уделить особое внимание, добавьте после нее восклицательные знаки или слова 'intricate' и 'detailed'.

Пример детального описания персонажа: 'gorgeous 30-year-old woman with long brown hair, green eyes!!!, detailed cheekbones, a sly grin'. Это описание переводится как '30-летняя очаровательная женщина с длинными темными волосами, выразительными зелеными глазами, четко очерченными скулами и лукавой улыбкой'.

Включение брендов и деталей одежды в Midjourney v5. В пятой версии, Midjourney развила умение распознавать и точно воспроизводить стилистику известных модных брендов, таких как 'Guess', 'Louis Vuitton' или 'New Balance'. Теперь вы можете специфицировать не только бренд, но и цвет, а также материал одежды, будь то хлопок, лен или кожа, что добавляет изображению дополнительную реалистичность и уникальность.

Пример детализированного описания одежды: 'woman wearing a stunning white lace Gucci gown with a full tulle skirt, intricate lace detailing, long lace sleeves, a high collar, and a fitted bodice adorned with delicate floral appliques'. В переводе это означает 'женщина в великолепном белом кружевном платье от Louis Vuitton с пышной юбкой из тюля, изысканным кружевным узором, длинными кружевными рукавами, высоким воротником и облегающим корсетом, украшенным нежными цветочными аппликациями'.

the man in Louis Vuitton
the man in Louis Vuitton
man in new balance
man in new balance
man in carrera
man in carrera
a man in a green linen shirt
a man in a green linen shirt
girl in a pink jacket
girl in a pink jacket
granny in a woolen shawl
granny in a woolen shawl
grandfather in a hat
grandfather in a hat
Man in the white cap
Man in the white cap

Выбор камеры для создания атмосферы в Midjourney

Важным аспектом при формулировке запроса является указание типа камеры, который влияет на цветокоррекцию и общее настроение снимка. Для этого добавьте в запрос 'shot on', за которым следует название камеры или тип пленки. Цифровые камеры обычно обеспечивают четкую контрастность, в то время как пленочные камеры придают изображению теплоту и мягкость. Вот несколько вариантов цифровых камер, которые вы можете использовать:

  • Hasselblad X1D: Это стандартный выбор для создания качественных снимков. Для получения немного других результатов можно попробовать такие камеры, как Canon EOS R6 Mark II Mirrorless, FUJIFILM X-T5 Mirrorless, Canon PowerShot G7 X Mark II, Control.
  • GoPro или GoPro Video: Эти камеры добавляют эффект 'рыбьего глаза' к селфи и идеально подходят для снимков, связанных с активными действиями.
  • Insta360 Pro: Это экшен-камера с возможностью съемки под углом 360°

Hasselblad X1 D
Hasselblad X1 D
GoPro
GoPro
Insta 360 Pro
Insta 360 Pro

Выбор пленки для пленочных фотографий в Midjourney

Для создания эффекта пленочной фотографии, важно указывать не тип камеры, а конкретный тип пленки. Вот несколько вариантов пленок, которые стоит рассмотреть:

  • Fujifilm Pro 400H: Это высокочувствительная пленка, идеально подходящая для дневного света. Отличный выбор для свадебной, рекламной и модельной фотографии.
  • Agfa Vista Plus 200: Пленка, хорошо передающая естественные тона кожи и адаптируемая к различному освещению. Идеальна для портретной фотографии.
  • Tri-X 400: Черно-белая пленка, прекрасно подходящая для съемки в сложных световых условиях.
  • Kodak Vision3 500: Оптимальна для естественного и солнечного освещения, особенно во время золотого часа.
  • Kodak Gold 200: Пленка с яркой насыщенностью, мелким зерном и высокой резкостью изображения, подходит для съемки при естественном освещении.
  • Kodak Portra: Идеальна для съемок на природе или в условиях легкого тумана.
  • Kodak Ektar: Предоставляет ретро-оттенки и контрастность изображениям.

Fujifilm Pro 400H
Fujifilm Pro 400H
Agfa Vista Plus 200
Agfa Vista Plus 200
Tri-X 400
Tri-X 400
Kodak vision3 500
Kodak vision3 500
Lomo
Lomo
Disposable Camera
Disposable Camera
Polaroid
Polaroid
Instax
Instax

Определение освещения для создания атмосферы на снимке в Midjourney.

Освещение играет ключевую роль в задании тона и создании общего настроения изображения. Важно указывать условия освещения, такие как 'sunny' (солнечно), 'cloudy' (облачно), 'rainy' (дождливо), 'snowy' (снежно), 'foggy' (туманно), 'hazey' (дымчато).

Также время суток существенно влияет на тип освещения и, следовательно, на визуальное восприятие снимка. Указывайте такие моменты, как 'sunrise' (рассвет), 'morning' (утро), 'afternoon' (полдень), 'golden hour' (золотой час), 'sunset' (закат), 'twilight' (сумерки), 'evening' (вечер), 'night' (ночь) для точного отображения желаемой атмосферы

dawn
dawn
rain and night
rain and night
snowy
snowy
golden hour
golden hour

Разновидности освещения и его источники в Midjourney

Midjourneyпозволяет указывать тип освещения и его источник, что значительно улучшает качество и атмосферу снимка. Например:

  • Studio Lighting: Студийное освещение с использованием искусственных источников света, часто применяется для портретной и коммерческой фотографии.
  • Natural Lighting: Естественное дневное освещение, идеально подходит для создания естественных и свежих изображений.
  • Off-Camera Flash: Имитация портативной вспышки, создает эффект ночного снимка с освещенным лицом.
  • Spot Lighting: Фокусированное освещение, которое подчеркивает определенные участки изображения.
  • Backlight with Hair Light: Освещение с эффектом 'сквозь волосы', создает красивые блики и контрасты.
  • Split Lighting with Rim Light: Боковое освещение с подсветкой волос, добавляет изображению драматизма и глубины.
  • Silhouette Lighting with Side Light: Контровое освещение с боковым светом, идеально для создания силуэтов с четкими контурами на фоне

studio lighting
studio lighting
natural Lighting
natural Lighting
off-Camera Flash
off-Camera Flash
spot Lighting
spot Lighting
backlight with Hair Light
backlight with Hair Light
split Lighting with Rim Light
split Lighting with Rim Light
silhouette Lighting with Side Light
silhouette Lighting with Side Light

Создание композиции с разнообразным освещением в Midjourney

Чтобы получить уникальные и привлекательные изображения, стоит экспериментировать с комбинацией различного времени суток, погодных условий и бокового освещения. Например, попробуйте создать сцену в солнечный день или настроить неоновое освещение для туманного вечера.

Процесс создания идеального изображения часто включает метод проб и ошибок. Некоторые запросы могут не давать ожидаемого результата, а цвет освещения иногда может непреднамеренно изменить оттенки одежды или других элементов сцены. Не бойтесь экспериментировать с различными комбинациями и настройками, чтобы найти идеальное сочетание для вашего снимка.

medium Shot
medium Shot
Wide-Angle Shot
Wide-Angle Shot
close-Up Shot
close-Up Shot
full-Body Shot
full-Body Shot

Выбор позиции камеры для различных ракурсов в Midjourney.

Параметр позиции камеры влияет на угол съемки и расположение объекта в кадре. Рассмотрим несколько вариантов:

  • Wide-Angle Shot: Камера расположена далеко от объекта. Чтобы создать еще более широкий угол, используйте 'Ultra-Wide Angle' или 'Ultra Wide-Angle'. При использовании этого типа кадра важно описать происходящее на фоне, так как это повлияет на общую эстетику изображения, несмотря на размытость фона.
  • Medium Shot: Снимок снят с расстояния пояса. Уточняйте, что делает модель (например, 'сидит', 'идет', 'смотрит в телефон'), иначе она будет просто стоять, глядя в камеру. Существуют вариации среднего кадра, такие как 'Low-Angle Shot' (снизу) и 'High-Angle Shot' (сверху).
  • Close-Up Shot: Крупный план. Рекомендуется добавить конкретную эмоцию, например, 'радостный', 'удивленный', 'печальный'. Использование более описательных слов, таких как 'overjoyed', даст более выразительные результаты, чем простое 'happy'.
  • Full-Body Shot: Снимок в полный рост. Несмотря на то, что нейросеть иногда обрезает нижнюю часть тела, включая ноги и колени, можно добиться полного изображения персонажа в полный рост.

mountains
mountains
forest
forest
sea and palm trees
sea and palm trees

Определение локации для сцены в Midjourney

Локация имеет значительное влияние на контекст и атмосферу изображения. Укажите место действия, такое как город, пляж, квартира, кафе. Midjourneyобладает способностью воспроизводить известные города: вы можете добавить Лондон, Нью-Йорк, Токио или Москву в качестве фона. Нейросеть передает общую атмосферу, характерные черты городов и знаменитые здания, хотя и не создает точной копии реальности.

Также стоит продумать, что делает персонаж в выбранной локации: например, пьет кофе, ест, сидит и смотрит в окно. Если конкретное действие не указано, нейросеть дополнит сцену типичными для данной локации действиями. Например, на пляже персонаж может идти, а в кафе – сидеть за столиком.

Создание композиций изображений в Midjourney

Еще один эффективный метод включения локации – это отдельная генерация персонажа и фона, с последующим их объединением.

Для этого сначала создайте два отдельных изображения — одно для персонажа и другое для фона. Затем, с помощью функции /blend, в начале нового запроса, добавьте ссылки на эти изображения, после чего формулируйте обычный запрос для комбинирования их в одну композицию.

hero
hero
location
location
result
result

Выбор соотношения сторон в Midjourney

Очень важно указывать соотношение сторон изображения в конце запроса, используя команду --ar. По умолчанию, изображения в Midjourneyсоздаются с соотношением сторон 1:1, но это можно изменить в соответствии с вашими потребностями. Например, можно выбрать соотношение 4:3 для создания горизонтальных снимков, 3:4 для вертикальных или 16:9 для создания изображений в кинематографическом формате.

Использование стиля известных фотографов в Midjourney

Если вам не хочется тратить время на детальное описание освещения, атмосферы, угла съемки и других элементов, можно воспользоваться простым трюком. После описания вашего объекта или сцены, добавьте имя известного фотографа, и нейросеть постарается имитировать его уникальный стиль. Вы можете найти подходящих фотографов и их стили на https://midlibrary.io/categories/photographers, что значительно упростит процесс создания желаемого изображения.

Richard Avedon style
Richard Avedon style
Guy Aroch style
Guy Aroch style
Jacob Aue Sobol
Jacob Aue Sobol

Добавление известных личностей в запросы Midjourney

Для создания изображений знаменитостей, просто укажите в запросе их полные имена. Нейросеть Midjourney распознает внешность таких известных личностей, как Илон Маск, Леонардо ДиКаприо, Пэрис Хилтон, Билл Клинтон и многих других. Однако обратите внимание, что российские знаменитости могут быть менее точно воспроизведены, особенно если их изображения не так широко распространены в англоязычном интернете.

Для генерации персонажей из фильмов или сериалов лучше использовать имена персонажей, а не актеров, чтобы более точно соответствовать их образу. Например, 'Уолтер Уайт' будет работать лучше, чем 'Брайан Крэнстон'. Образы книжных персонажей нейросеть часто создает на основе фан-арта, а не на основе актеров из экранизаций.

Также не бойтесь экспериментировать, помещая знаменитостей в необычные для них сценарии или создавая абсурдные образы. Одежда, аксессуары и мимика для знаменитостей генерируются так же, как и для вымышленных персонажей.

При составлении запроса примените все рекомендации: добавьте освещение, выберите тип камеры и укажите ее положение для достижения максимального реализма в изображении.

Tyrion Lannister
Tyrion Lannister
Leonardo DiCaprio
Leonardo DiCaprio

Подписывайтесь! Ценно ведь