Найти тему

Гипермегареализм: модель PhotoReal нейросети Leonardo AI

...как живые!..

"Слава октябрю!", Leonardo AI, экран, пиксели, 2023. Фрагмент.
"Слава октябрю!", Leonardo AI, экран, пиксели, 2023. Фрагмент.

Сегодня я собираюсь выполнить данное обещание и показать вам, на что способна модель PhotoReal нейросетевой платформы Leonardo AI. Будет относительно немного текста и очень много картинок, потому что посмотреть есть на что. Но начну я для порядка всё же с пары технических иллюстраций, то бишь скриншотов.

Итак, найти PhotoReal можно в галерее моделей:

PhotoReal в галерее моделей Leonardo AI
PhotoReal в галерее моделей Leonardo AI

...хотя делать это нет необходимости. Разработчики так гордятся моделью, что выделили для неё специальное место в боковой панели инструментов на странице генерации:

Немногочисленные настройки PhotoReal
Немногочисленные настройки PhotoReal

Настроек у PhotoReal не так уж и много: глубина резкости (небольшая, средняя и большая) и режим RAW, который рекомендуют включать для длинных сложных запросов. Рядом с названием модели в окне генерации есть небольшой выпадающий список стилей. Наибольшего реализма можно добиться, используя кинематографичный (Cinematic) стиль, который установлен по умолчанию.

PhotoReal не позволяет использовать ни Negative prompt (минус-слова), ни инструмент Prompt Magic.

Особенность этой модели в том, что, в отличие от всех остальных, она может работать только при активированном режиме Alchemy, что автоматически делает её платной (Alchemy ― премиум-режим, который доступен только пользователям с оплаченной подпиской. Ссылки на материалы о нём я поставлю в конце статьи). На сегодня это единственная платная модель Leonardo.

Мне доступ к священной корове достался только на промо-период, который разработчики по ошибке продлили на семь дней вместо заявленных пяти. Не исключаю, что у кого-то из вас есть возможность оплатить подписку и пользоваться Alchemy неограниченно. Остальные же, как и я, могут внезапно получить от Leonardo пять (или семь, как повезёт) дней доступа в подарок, и в этом случае вам лучше знать заранее, на что рассчитывать.

Итак, перейду собственно к картинкам. С детализацией и передачей света и тени у PhotoReal всё отлично. Изображения действительно выглядят как настоящие фотографии, и более убедительных результатов не достигает, наверное, ни одна другая модель. После первого "вау", впрочем, начинаешь замечать её слабые места.

Во-первых, как бы странно это ни звучало, это воображение: оно у модели жёстко ограничено реальным миром. Вот такие результаты (и ещё два подобных) получились при попытке создать инопланетное, экзотичное, фантастическое существо, не-человека. Слова non-human были в тексте запроса:

"Нечеловека" нейросеть полностью проигнорировала. Девушка красивая, не спорю. Но вполне земная. Даже родинки на щеке есть.

Ещё одна попытка создать невиданное сказочное существо, и PhotoReal мечется, не зная, что делать: ну не может модель просто взять и скрестить бульдога с носорогом, к тому же она явно слишком долго тренировалась на людях. Поэтому из четырёх созданных по одному запросу (a fantasy creature, long iridescent spikes, silver fur, fangs, multiple eyes) картинок на двух мы снова видим человека, пусть и в экзотических шаманских шапках. С клыками и множеством глаз как-то не задалось:

Вообще фантастические существа в исполнении модели, если они не похожи на обычных людей, то больше всего напоминают либо волчьих, либо кошачьих. Вот, например, великолепный большеухий песец, у которого должны были быть большие синие крылья и светящиеся глаза:

Следующий персонаж задумывался как футуристичный человекоподобный робот в стилизованных средневековых доспехах ― ну таких, чтобы из прозрачного пластика, с кнопками, трубками, экранчиками, светодиодами и прочим, ― но вышел просто доспех. Никакого кибер-medieval-панка. Совсем.

Или возьмём, к примеру, богиню Бастет. В запросе было недвусмысленно сказано, что требуется прямо вот натуральная древнеегипетская богиня, женщина с головой кошки. Результат ― "мы с Барсиком на Хэллоуин":

Кстати, если девичьи лица вам начинают казаться одинаковыми, ― вам не кажется. Это второй недостаток PhotoReal: похоже, модель обучали на очень ограниченном наборе фотографий людей. Или, возможно, наоборот: модель усредняет все черты, которые ей попадаются, и создаёт одинаково правильные, гармоничные, неразличимые лица.

Куда хуже дело обстоит с руками. При всей своей продвинутости PhotoReal всё так же не всегда способна правильно нарисовать кисти рук и пальцы:

Иногда не очень хорошо удаются зубы. У первого парня из этих двоих всего один передний резец (или сразу три, это как посмотреть):

Второму повезло больше, хоть резцы и разного размера. Наверное, брекеты помогли. Хотя всё же с зубами нейросети продвинулись очень заметно. Помните жуткие челюсти-трёхрядки в исполнении "Кандинского"? Надеюсь, они остались в прошлом.

Если не пытаться проводить межвидовое и межродовое скрещивание, PhotoReal справляется лучше, хотя и тут многого себе не позволяет. У этой сказочной птички должен был быть золотой клюв и оперение не хуже чем у Жар-птицы. Получилось убедительно, но всё же больше похоже на безумную селекцию, чем на магию:

С рыбками та же история. Красивые, но магии не хватает:

Вот к роботам придраться сложно. Но можно: у этого тоже должен был быть прозрачный корпус, под которым видна была бы начинка:

Змей-искуситель немножко поломался, хотя это и не слишком заметно:

Но что хорошо удаётся модели, так это еда. Если списать порубленные топором фрукты на странности кондитера, эти торты выглядят как настоящие:

Ну и под занавес ― задание на внимательность. Сможете найти среди этих настоящих фотографий подделку от PhotoReal?

Статьи про Alchemy:

Алхимик Леонардо: режим Alchemy нейросети Leonardo AI

Режим Alchemy нейросети Leonardo: разбираемся в настройках