Найти тему

Нейросети рисующие. Сравниваю

Оглавление

У Stable Diffusion есть несколько версий, они очень разные, поэтому расскажу про них отдельно:

Stable Diffusion 1.5

Понимает названия национальностей и на запрос "славянин" рисует славянина, а не американца или корейца.

Очень-очень-очень большой разброс того, что может выдать по одному и тому же запросу в одном и том же режиме.

Очень чувствительна к негатив-промпту: если забыть перечислить всё то, чего не хочешь видеть, картинка не порадует совершенно.

В общем, это моя любимая рисующая нейросеть.

С кистями рук, стопами, количеством и видом пальцев у неё традиционная проблема. Зато портреты... В общем, моя любимая сейчас нейросеть.

Stable Diffusion XL

Умеет сама пересчитывать количество голов, рук и ног.

Не очень чувствительна к настройкам - зато и не требует настройки. Выбираем режим, пишем в двух словах свои пожелания, и получаем приличный результат даже без негатив-промпта. Достаточно написать "осенний пейзаж" - и получишь осенний пейзаж с хорошей композицией, какой-нибудь природой и горами на заднем плане.

Выдаёт нормальную или хорошую композицию почти всегда.

По одному и тому же промпту она выдаёт довольно однотипные картинки.

О-о-очень часто рисует о-о-о-о-очень длинные шеи :-(

Часты проблемы с зубами. Посмотрите последнюю картинку в карусели: посередине улыбки не стык двух зубов, как должно быть, а один большой зуб.

Национальности не понимает, и на запрос "славянин" стабильно выдаёт американцев.

Stable Diffusion 2.1

Про эту версию мне сказать нечего - мне она с первого взгляда не понравилась, и я ею не пользуюсь.

Kandinsky 2.2

Промпты можно писать не русском - это плюс. (В Stable Diffusion на самом деле тоже можно, но она понимает их через раз).

Настроек вообще не требует никаких... Собственно, настроек и нет. Можно выбрать режим. Можно задать промпт и негатив-промпт. И всё. Результаты по одному промпту в одном режиме очень похожи между собой.

Передний план не дружит с фоном. Совсем. У них освещение от разных источников. Модель эффектно освещается сбоку, а фон... как получится.

И руки немного разные. Но это я уже придираюсь.

Вывод... Какой вывод?

ЗА: а про Midjourney тут не будет, совсем.