Найти в Дзене

Как автоматизировать генерацию изображений нейросетью

Я автор канала Без движка, спец по машинному обучению со стажем. В свободное время делаю игры и пишу про свой опыт и лайфхаки, которые я нашел. Подписывайтесь в дзене и телеграмме!

Как не писать промпты самому

Почти всегда, когда мне нужно нарисовать картинку с кучей деталей, я не пишу промпты вручную. Нейросети справляются с этим гораздо лучше.

Прикол в том, что ChatGPT, ChatGPT Turbo и ChatGPT-Omni в этом деле - полный ноль. Вот вообще ничего путного не выдали, представляете? Просишь написать "промпт для генерации набора реалистичных кристаллов разной формы для dalle" - получается "сгенерируй реалистичный кристалл на выходе" от модели, что конечно бесполезная вещь.

Claude 3.5 Sonnet и 3 Opus дают гораздо более приятные результаты, добавляя в промпт стиль и прочие детали.

Для наглядности

Первое фото - генерация по простенькому промпту, написанному руками:

beautiful fantasy character --s 250 --niji 6

А второе - по промпту, который выдал Claude на запрос "напиши промпт для Midjourney для генерации красивого фэнтезийного персонажа":

-2
Ethereal fantasy character, luminous skin, iridescent eyes, flowing hair with magical particles, intricate ornate armor, mystical aura, wielding a glowing crystal staff, surrounded by floating runes, hyper-detailed, cinematic lighting, 8k resolution, digital painting style --niji 6 --s 250

Бонусом получаем то, что промпт от нейросети легко редактировать. Достаточно сказать "Я хочу персонажа в огненном стиле" и последний промпт без моих усилий превращается в

-3
Fiery fantasy character, glowing ember skin, smoldering orange eyes, flaming hair with sparks, intricate obsidian armor with lava veins, scorching aura, wielding a blazing phoenix staff, surrounded by swirling flames and ash, hyper-detailed, dramatic lighting with fire glow, 8k resolution, digital painting style --niji 6 --s 250

А вот я попросил перевести картинку в сеттинг Minecraft и потом Portal 2 (внес 0 изменений в промпт, все что выдала Claude 3.5 подал на вход midjourney):

Minecraft fantasy character, glowing magma block skin, bright orange eyes, fire particle hair, black obsidian armor with lava streaks, surrounded by fire particles, holding a blaze rod staff, standing in a nether fortress, pixelated 16x16 textures, dramatic lighting from nearby lava, Minecraft render style --niji 6 --s 250
-4
GLaDOS redesign, sleek white chassis with glowing orange accents, piercing amber optic, cables resembling fiery tendrils, obsidian-black panels with energy conduits, ominous aura, central core wielding a portal device modified to shoot flames, surrounded by swirling orange portals and Aperture Science warning signs, hyper-detailed, dramatic lighting from energy cores, clean futuristic laboratory setting, Portal 2 art style --niji 6 --s 250
-5

Без движка - подписывайтесь также в телеграм!