Уже все встречали у друзей в ленте социальных сетей самые различные фото самого различного качества и уровня исполнения с их лицами. Начиная от полумультяшных изображений, заканчивая почти что серьезными фото.
Встречали, знаю.
Думаю, эта ниша будет интересна широкой аудитории. Мне нужно было поэкспериментировать для некоторых целей (в том числе - сохранение персонажа для нашей антиутопии). В итоге есть контент и понимание, как и что делать, есть результат… а чего добру пропадать? Отдаю всем желающим)))
И не буду скрывать, что мне сегодня, сейчас про нейросети интереснее писать/показывать, чем про очередное алиментное чудо или наследного-банкротного рвача.
Итак, поехали.
В чем смысл "нейрофотосессии"?
В том, что вы берете свое собственное фото и переносите себя в... различные образы. В зависимости от инструмента то может быть как банальщина, в виде грубой замены одного лишь лица, так и чем-то более серьезным.
Для примера в качестве референса (исходного фото) возьмем вот такую девушку.
Сгенерирована, реально не существует. Вроде симпатишная. Генерировалась как один из образов Кати – подруги Васи из нашей юридической антиутопии.
В вашем случае, разумеется, будет ваше фото. Рекомендую использовать именно такой формат, как на референсном примере. Иначе могут быть проблемы с более-менее достоверным сохранением лица, фигуры и так далее.
Промпты НЕ МОИ. Взяты для примера, немного менялись и подгонялись под образ референсного персонажа. Я такие сложные промпты составлять настолько детально не умею, не мой профиль.
Я всё думал, как их разместить так, чтобы не перегружать статью. Придумал: промпты будут в карусели. Первое фото – результат, второе – промпт, если интересно посмотреть. Для удобства и использования в конце дам ссылку на текстовый файл с ними, пользуйтесь.
Фото 1: Строгое что-нибудь
Будет у нас светская львица с покупками.
Получилось ни разу нереалистично. За реальное фото не покатит, выглядит как-то… несуразно. Ну да ладно, главное – начать. Попробуем что-нибудь более веселое.
Пошалим?😈
Фото 2. Что-нибудь волнующее…
«Публичные» нейросети имеют ОЧЕНЬ жесткие ограничения по цензуре и кексуализированному (что такое "кекс" – вы поняли, думаю. Мы на Дзене, тут еще круче) контенту.
Даже безобидно-элементарное вроде топика, купальника, боди, «девушки в халате на кровати» и так далее вызывает отбой запроса. Низя, упс.
Тем не менее, можно получить что-то такое:
Это очень сложный промпт, детальный, прописывающий множество мелочей.
Нейросеть проигнорировала запрос «полулежа», в сочетании с открытыми элементами одежды этого добиться невозможно.
Я столкнулся с этой каменной стеной, пытаясь сгенерировать безобидный видеоролик-прикол на тему измен и уехавшего из дома мужа. Нейтральные темы «женщины на кровати в халате» взорвали мозг и сожгли недельный запас генераций… Результат (сегодня выглядящий откровенно фу) – в Телеграм. А всего-то два месяца прошло…
Фото 3: Киберпанк!
А вообще мне не нравятся эти гламурные промпты. Напрочь. Памятуя предысторию референсного фото, давайте что-нибудь в стиле киберпанка сделаем. И не просто сделаем, а попросим ту же Gemini написать нам идеи и промпты для нейрофотосессии!
Просим вот так, максимально примитивно:
Набросай два сценария нейрофотосессии в стиле Киберпанк и Стимпанк для девушки, в виде промпта для себя же.
Если не уточнять – сделает промпт на английском, хотя в основной массе неплохо понимает и русский. Если дело до Veo 3 (генерация видео) не доходит.
Применяем предлагаемый промпт и…
Мультяшка. Сильная мультяшка. Не пойдет. У нас фотосессия! Почти классическая «нейромазня»
А стимпанк?
Чуть получше. Всему виной неправильные настройки стиля, освещения и так далее, но мы же не морочимся, а все делаем из коробки.
Двигаемся дальше. Что-нибудь реалистичное…
Фото 4: Дорого, богато, по-женски…
Мамзель в машине. Главное – не на ходу, но это неточно! Получилось неплохо.
Естественность кадра на «четверку», вылизанная картинка уже не так бросается в глаза. Выглядит как отредактированное фото от профи. Типично для гламура «дорохо-бохато».
Фото 5: Домашнее
Будем считать поклонницей. Надпись как пример весьма достойной работы со сложными русскими словами.
Слово на надписи сложное, потому что не переводится по факту корректно. В случае с запрошенной надписью на картинке нейронка прописывает его «как есть».
Общий вид… Потерялся цвет глаз. Сильно потерялся. Такие косяки – норма, но они реже при более крупных планах референса и с реальными фото. Не забываем, что у нас референс – нейродевушка с далеко не фотореалистичным образом.
Фото 6. Розовый гламур
А теперь давайте похулиганим чуть-чуть опять. А то скукота…
Например, так:
Немногочисленные мужчины-читатели явно рады визуальному образу. Получился со второго раза, предлагаемый промпт был немного другой. Пришлось править, так как эпизодически нейронка начинает тупить то на "мини-юбку", то на "топ", ругаясь, что «не может генерировать людей в таком образе». Ок. Не можешь, попробуй еще раз…
Фото 7: Ты гля какая…
Снова гламур, тачки и улица.
Скучно. Но вы то можете самостоятельно прописывать любые образы! Попросите нейросеть помочь с описанием стилистики и так далее.
Пожалуй, пора заканчивать с девицами. Ах да, дамы могут себе в этой штуке подбирать образы, прическу, одежду и так далее...
Шучу думаете? А вот и нет. Наша виртуальная героиня во всех вариациях:
Промпт простой:
Создай один кадр с 6 портретными снимками одной и той же женщины, каждый из которых демонстрирует уникальную прическу — каре слоями, свободные волны, гладкий конский хвост, текстурированная пикси (короткая стрижка), прямые волосы до плеч и боковые локоны. Сохраните идентичными черты ее лица и равномерным освещение, а также расположите их в аккуратной сетке 2×3 для создания современного, профессионального вида.
Можете править под свои нужды.
Где и как это всё сделать?
Как уже говорил, все операции проводились через Gemini от Google. Помимо фотосессий, это реально "нейрофотошоп", который может править что угодно, создавать как угодно и решать любые задачи.
Расположена по адресу gemini.google.com/app, есть 10 бесплатных запросов, но… из России недоступна. Как ходить «не из России» я оглашать не вправе, ибо закон-с, поэтому могу предложить воспользоваться VeoSeeBot в Телеграм. Не реклама, реально сам пользуюсь и рекомендую как простой и удобный способ попробовать свои силы в нейросетях, к тому же на русском языке. Бесплатно выдается несколько приветственных попыток, платное же использование генераций обойдется в 3-6 рублей за попытку в 1-2 кадра. Более чем понятный интерфейс.
Там же найдете примеры промптов, в том числе те, которые выше.
Примеры использованных промптов тут в этом файле, для копирования.
Кому нужно серьезно – те и без меня разберутся, как получить постоянный доступ напрямую =)
Стоп. Рано разбегаться! Еще вариант…
Gemini – это простой вариант. Реальной просто именно для обывателя (без обид). Какие-то проблемы на фото там можно устранить простейшими командами.
Типа "убери волосы с лица", "замени кружку на стакан" и так далее. Вплоть до "убери лишнюю руку справа", если вдруг такая появится. Бывает =) Это фотошоп.
Есть более сложный, FLUX Kontext. Главная сложность, что промпт там только на английском. Даже в большинстве «прокладок», типа бота выше (там тоже доступен).
С его помощью я сохранял идентичность персонажа вот в этом видео:
Реалистичность динамического кадра слегка хромает, так как это было 2 месяца назад, а те технологии уже безбожно устарели… Не шучу, кстати.
Попробуем пару кадров с нашей нейрогероиней и в максимально примитивном стиле.
Пишем такой промпт:
A girl from the photo is sitting in an outdoor café under an awning, drinking coffee, wearing a light summer dress, with a plate with a pastry on the table, and a blurred background of the street behind her, with cars driving and people walking.
Переведен так же с помощью Гемини.
Перевод:
Девушка с фото сидит в уличном кафе под навесом, пьет кофе, одета в легкое летнее платье, на столе тарелка с пирожным, позади размытый фон улицы, ездят машины, идут люди.
Получилось вот такое фото:
Ну… в целом тоже неплохо. Претензия на реализм.
Возьмем английский промпт в тематике стимпанк, который нам придумала Гемини в фото 3.
Реалистичностью тут и не пахнет. Просто киношно-красиво.
Констатирую еще раз, что Гемини остается пока что одним из самых простых и при этом гибких инструментов для работы с изображениями. Потому как поразвлекаться, повеселить друзей-знакомых какими-нибудь приколами по силам будет каждому.
Отдельно замечу, что с РЕАЛЬНЫМ фото результат будет немного другим. Лучше. Но использовать случайное-чужое фото я не стал, так как не имею морального и юридического права. Экспериментируйте сами =)
Такие вот дела…
«Нравлик», если было интересно и не забываем подписываться!
Тему нейросетей буду эпизодически поднимать в таком инструктивном стиле, если публикация наберет от 1000 «нравликов». Это будет означать, интересно и познавательно!
ВКонтакте || Телеграм || MAX || Одноклассники || RuTube
💸 Донаты приветствуются: поддержать автора канала можно по кнопке ниже или по этой ссылке. Как мы все в курсе - финансово Дзен совсем стал "не торт".