Найти в Дзене
ПсихоЮрист

Показываю как сделать фотосессию в нейросети за 15 минут. Удиви жену или друзей!

Оглавление

Уже все встречали у друзей в ленте социальных сетей самые различные фото самого различного качества и уровня исполнения с их лицами. Начиная от полумультяшных изображений, заканчивая почти что серьезными фото.

Встречали, знаю.

Думаю, эта ниша будет интересна широкой аудитории. Мне нужно было поэкспериментировать для некоторых целей (в том числе - сохранение персонажа для нашей антиутопии). В итоге есть контент и понимание, как и что делать, есть результат… а чего добру пропадать? Отдаю всем желающим)))

И не буду скрывать, что мне сегодня, сейчас про нейросети интереснее писать/показывать, чем про очередное алиментное чудо или наследного-банкротного рвача.

Итак, поехали.

В чем смысл "нейрофотосессии"?

В том, что вы берете свое собственное фото и переносите себя в... различные образы. В зависимости от инструмента то может быть как банальщина, в виде грубой замены одного лишь лица, так и чем-то более серьезным.

Для примера в качестве референса (исходного фото) возьмем вот такую девушку.

-2

Сгенерирована, реально не существует. Вроде симпатишная. Генерировалась как один из образов Кати – подруги Васи из нашей юридической антиутопии.

В вашем случае, разумеется, будет ваше фото. Рекомендую использовать именно такой формат, как на референсном примере. Иначе могут быть проблемы с более-менее достоверным сохранением лица, фигуры и так далее.

Промпты НЕ МОИ. Взяты для примера, немного менялись и подгонялись под образ референсного персонажа. Я такие сложные промпты составлять настолько детально не умею, не мой профиль.

Я всё думал, как их разместить так, чтобы не перегружать статью. Придумал: промпты будут в карусели. Первое фото – результат, второе – промпт, если интересно посмотреть. Для удобства и использования в конце дам ссылку на текстовый файл с ними, пользуйтесь.

Фото 1: Строгое что-нибудь

Будет у нас светская львица с покупками.

Получилось ни разу нереалистично. За реальное фото не покатит, выглядит как-то… несуразно. Ну да ладно, главное – начать. Попробуем что-нибудь более веселое.

Пошалим?😈

Фото 2. Что-нибудь волнующее…

«Публичные» нейросети имеют ОЧЕНЬ жесткие ограничения по цензуре и кексуализированному (что такое "кекс" – вы поняли, думаю. Мы на Дзене, тут еще круче) контенту.

Даже безобидно-элементарное вроде топика, купальника, боди, «девушки в халате на кровати» и так далее вызывает отбой запроса. Низя, упс.

Тем не менее, можно получить что-то такое:

Это очень сложный промпт, детальный, прописывающий множество мелочей.

Нейросеть проигнорировала запрос «полулежа», в сочетании с открытыми элементами одежды этого добиться невозможно.

Я столкнулся с этой каменной стеной, пытаясь сгенерировать безобидный видеоролик-прикол на тему измен и уехавшего из дома мужа. Нейтральные темы «женщины на кровати в халате» взорвали мозг и сожгли недельный запас генераций… Результат (сегодня выглядящий откровенно фу) – в Телеграм. А всего-то два месяца прошло…

Фото 3: Киберпанк!

А вообще мне не нравятся эти гламурные промпты. Напрочь. Памятуя предысторию референсного фото, давайте что-нибудь в стиле киберпанка сделаем. И не просто сделаем, а попросим ту же Gemini написать нам идеи и промпты для нейрофотосессии!

Просим вот так, максимально примитивно:

Набросай два сценария нейрофотосессии в стиле Киберпанк и Стимпанк для девушки, в виде промпта для себя же.

Если не уточнять – сделает промпт на английском, хотя в основной массе неплохо понимает и русский. Если дело до Veo 3 (генерация видео) не доходит.

Применяем предлагаемый промпт и…

-5

Мультяшка. Сильная мультяшка. Не пойдет. У нас фотосессия! Почти классическая «нейромазня»

А стимпанк?

Чуть получше. Всему виной неправильные настройки стиля, освещения и так далее, но мы же не морочимся, а все делаем из коробки.

Двигаемся дальше. Что-нибудь реалистичное…

Фото 4: Дорого, богато, по-женски…

Мамзель в машине. Главное – не на ходу, но это неточно! Получилось неплохо.

Естественность кадра на «четверку», вылизанная картинка уже не так бросается в глаза. Выглядит как отредактированное фото от профи. Типично для гламура «дорохо-бохато».

Фото 5: Домашнее

Будем считать поклонницей. Надпись как пример весьма достойной работы со сложными русскими словами.

Слово на надписи сложное, потому что не переводится по факту корректно. В случае с запрошенной надписью на картинке нейронка прописывает его «как есть».

Общий вид… Потерялся цвет глаз. Сильно потерялся. Такие косяки – норма, но они реже при более крупных планах референса и с реальными фото. Не забываем, что у нас референс – нейродевушка с далеко не фотореалистичным образом.

Фото 6. Розовый гламур

А теперь давайте похулиганим чуть-чуть опять. А то скукота…

Например, так:

Немногочисленные мужчины-читатели явно рады визуальному образу. Получился со второго раза, предлагаемый промпт был немного другой. Пришлось править, так как эпизодически нейронка начинает тупить то на "мини-юбку", то на "топ", ругаясь, что «не может генерировать людей в таком образе». Ок. Не можешь, попробуй еще раз…

Фото 7: Ты гля какая…

Снова гламур, тачки и улица.

Скучно. Но вы то можете самостоятельно прописывать любые образы! Попросите нейросеть помочь с описанием стилистики и так далее.

Пожалуй, пора заканчивать с девицами. Ах да, дамы могут себе в этой штуке подбирать образы, прическу, одежду и так далее...

Шучу думаете? А вот и нет. Наша виртуальная героиня во всех вариациях:

-11

Промпт простой:

Создай один кадр с 6 портретными снимками одной и той же женщины, каждый из которых демонстрирует уникальную прическукаре слоями, свободные волны, гладкий конский хвост, текстурированная пикси (короткая стрижка), прямые волосы до плеч и боковые локоны. Сохраните идентичными черты ее лица и равномерным освещение, а также расположите их в аккуратной сетке 2×3 для создания современного, профессионального вида.

Можете править под свои нужды.

Где и как это всё сделать?

Как уже говорил, все операции проводились через Gemini от Google. Помимо фотосессий, это реально "нейрофотошоп", который может править что угодно, создавать как угодно и решать любые задачи.

Расположена по адресу gemini.google.com/app, есть 10 бесплатных запросов, но… из России недоступна. Как ходить «не из России» я оглашать не вправе, ибо закон-с, поэтому могу предложить воспользоваться VeoSeeBot в Телеграм. Не реклама, реально сам пользуюсь и рекомендую как простой и удобный способ попробовать свои силы в нейросетях, к тому же на русском языке. Бесплатно выдается несколько приветственных попыток, платное же использование генераций обойдется в 3-6 рублей за попытку в 1-2 кадра. Более чем понятный интерфейс.

Там же найдете примеры промптов, в том числе те, которые выше.

Примеры использованных промптов тут в этом файле, для копирования.

Кому нужно серьезно – те и без меня разберутся, как получить постоянный доступ напрямую =)

Стоп. Рано разбегаться! Еще вариант…

Gemini – это простой вариант. Реальной просто именно для обывателя (без обид). Какие-то проблемы на фото там можно устранить простейшими командами.

Типа "убери волосы с лица", "замени кружку на стакан" и так далее. Вплоть до "убери лишнюю руку справа", если вдруг такая появится. Бывает =) Это фотошоп.

Есть более сложный, FLUX Kontext. Главная сложность, что промпт там только на английском. Даже в большинстве «прокладок», типа бота выше (там тоже доступен).

С его помощью я сохранял идентичность персонажа вот в этом видео:

Реалистичность динамического кадра слегка хромает, так как это было 2 месяца назад, а те технологии уже безбожно устарели… Не шучу, кстати.

Попробуем пару кадров с нашей нейрогероиней и в максимально примитивном стиле.

Пишем такой промпт:

A girl from the photo is sitting in an outdoor café under an awning, drinking coffee, wearing a light summer dress, with a plate with a pastry on the table, and a blurred background of the street behind her, with cars driving and people walking.

Переведен так же с помощью Гемини.

Перевод:

Девушка с фото сидит в уличном кафе под навесом, пьет кофе, одета в легкое летнее платье, на столе тарелка с пирожным, позади размытый фон улицы, ездят машины, идут люди.

Получилось вот такое фото:

-12

Ну… в целом тоже неплохо. Претензия на реализм.

Возьмем английский промпт в тематике стимпанк, который нам придумала Гемини в фото 3.

-13

Реалистичностью тут и не пахнет. Просто киношно-красиво.

Констатирую еще раз, что Гемини остается пока что одним из самых простых и при этом гибких инструментов для работы с изображениями. Потому как поразвлекаться, повеселить друзей-знакомых какими-нибудь приколами по силам будет каждому.

Отдельно замечу, что с РЕАЛЬНЫМ фото результат будет немного другим. Лучше. Но использовать случайное-чужое фото я не стал, так как не имею морального и юридического права. Экспериментируйте сами =)

Такие вот дела…

«Нравлик», если было интересно и не забываем подписываться!

Тему нейросетей буду эпизодически поднимать в таком инструктивном стиле, если публикация наберет от 1000 «нравликов». Это будет означать, интересно и познавательно!

ВКонтакте || Телеграм || MAX || Одноклассники || RuTube

💸 Донаты приветствуются: поддержать автора канала можно по кнопке ниже или по этой ссылке. Как мы все в курсе - финансово Дзен совсем стал "не торт".