Друзья, есть как минимум три способа, с помощью которых можно выяснить текстовый запрос, по которому генерировалась та или иная картинка.
Зачем это нужно?
Это требуется тогда, когда вам понравилось конкретное изображение, но вы не знаете, какой запрос нужно написать для нейросети, чтобы получить подобное изображение. Как правило, одного изображения в качестве исходника недостаточно для того, чтобы получить удовлетворительный результат.
Итак, вот эти способы:
1. Сервис methexis-inc
Находится он здесь: https://replicate.com/methexis-inc/img2prompt
Для проведения эксперимента воспользуюсь картинкой:
Я загрузила картинку (под картинкой специальное поле для загрузки), нажала кнопку <Submit> и через несколько секунд получила промт (раздел Output):
Вот промт (текстовый запрос):
a bunch of red berries hanging from a tree, a macro photograph by Peter Snow, shutterstock contest winner, ecological art, associated press photo, macro photography, creative commons attribution
(гроздь красных ягод, свисающих с дерева, макрофотография Питера Сноу, победителя конкурса Shutterstock, экологическое искусство, ассоциированное фото для прессы, макрофотография, атрибуция Creative Commons)
2. Сервис pharmapsychotic/clip-interrogator
CLIP Interrogator — инструмент разработки подсказок, который сочетает в себе CLIP OpenAI и BLIP Salesforce для оптимизации текстовых подсказок в соответствии с заданным изображением.
Ссылка на сервис: https://replicate.com/pharmapsychotic/clip-interrogator
А так выглядит главная страница:
По какой-то причине мне не удалось получить описание моей картинки с помощью данного сервиса. Результат не понятен (см. раздел Output):
Такая же ситуация и с другими картинками, описание которых я пыталась получить. Причина мне пока неизвестна.
Друзья, напишите, если у вас работает сервис CLIP Interrogator.
3. Нейросеть Stable Diffusion (раздел PNG Info)
Для чистоты эксперимента я загрузила ту же самую картинку в раздел <PNG Info>:
И что в результате ? НИЧЕГО.
А это значит, что данная картинка была создана не в Stable Diffusion (SD).
Теперь загружаю картинку, созданную ранее в SD:
И справа внизу видно промт, по которому я создавала картинку:
big animal opposite ykurilov guy from the movie Avatar 2009, octane rendering trends, 8k art photography, photorealistic concept art, soft, dramatic, photorealistic, perfect composition, beautiful detailing, intricate, insanely detailed octane render Popular on artstation, art photography 8k, photorealistic concept art, soft natural 3D cinematic perfect light, chiaroscuro, award-winning photography, masterpiece
(большое животное напротив парня юкурилова из фильма Аватар 2009, тренды октанового рендеринга, 8к художественная фотография, фотореалистичный концепт-арт, мягкий, драматичный, фотореалистичный, идеальная композиция, красивая детализация, замысловатый, безумно детализированный октановый рендер Популярное на артстанции, художественная фотография 8к, фотореалистичный концепт-арт, мягкий естественный 3D-кинематографический идеальный свет, светотень, отмеченная наградами фотография, шедевр)
Также видны параметры, которые использовались при создании изображения:
Steps: 32, Sampler: DDIM, CFG scale: 8, Seed: 3934973508, Size: 704x512, Model hash: 7dd1e32e, Denoising strength: 0.53, Mask blur: 4, SD upscale overlap: 64, SD upscale upscaler: R-ESRGAN 4x+.
Таким образом, с помощью данного способа можно определять по любому изображению, созданному в SD, текстовый запрос, на основании которого оно было сгенерировано.
После это изображение можно отправить в раздел <img2img>, нажав кнопку <Send to img2img> для последующей генерации такого же или похожего изображения. При этом можно корректировать промт, если что-то нужно изменить в исходной картинке.
_________________________________________________
P.S. Приглашение на Мастер-Классы по изучению Топовых Нейросетей, где Вас ждут Бонусы и Подарки: