Найти в Дзене
Нейро Арт

Я так вижу. Царица, ANNA ASTI.

Продолжаем рубрику "Я так вижу". В этом посте посмотрим, как разные нейросети видят песню "Царица". Что примечательно, текст достаточно абстрактен в плане описания, и нейронкам сложно зацепиться за что-то, чтобы выдавать стабильный результат. При этом каждая нейросеть воспринимает текст сильно по-своему.
Собственно, сама песня: Ну а дальше начинается веселье :). Посмотрите, что вышло у разных нейросетей, под картинками - мои впечатления и замечания.
Спойлер. Для нетерпеливых - листайте в самый низ, последние два участника - самые интересные, на мой взгляд.
Ideogram выдал одну более-менее попадающую картинку, остальное - лютая дичь. Что в очередной раз приводит меня к мысли, что не все платные нейронки крутые, и не все бесплатные - мусор. Recraft понял текст сильно лучше, изобразил уверенную в себе танцующую девушку, причем встроенные фильтры позволяют получить стилизованное изображение, а не только фотореализм Flux как всегда, справился достойно. Flux Dev на домашнем ПК нарисовал тан

Продолжаем рубрику "Я так вижу".

В этом посте посмотрим, как разные нейросети видят песню "Царица". Что примечательно, текст достаточно абстрактен в плане описания, и нейронкам сложно зацепиться за что-то, чтобы выдавать стабильный результат. При этом каждая нейросеть воспринимает текст сильно по-своему.
Собственно, сама песня:

Ну а дальше начинается веселье :). Посмотрите, что вышло у разных нейросетей, под картинками - мои впечатления и замечания.


Спойлер. Для нетерпеливых - листайте в самый низ, последние два участника - самые интересные, на мой взгляд.

Ideogram
Ideogram

Ideogram выдал одну более-менее попадающую картинку, остальное - лютая дичь. Что в очередной раз приводит меня к мысли, что не все платные нейронки крутые, и не все бесплатные - мусор.

Recraft понял текст сильно лучше, изобразил уверенную в себе танцующую девушку, причем встроенные фильтры позволяют получить стилизованное изображение, а не только фотореализм

Flux как всегда, справился достойно. Flux Dev на домашнем ПК нарисовал танцующую пару, и да, можно предположить, что "мальчик поплыл". А Flux Pro сгенерировал просто симпатичную девушку на танцполе, но просто посмотрите на качество генерации - как будто и правда фото со вспышкой. Расхваленная Flux Ultra с задачей не справилась, идею песни не передала от слова совсем, и прикладывать ее творчество я не буду. Может это мне не повезло, но тратить еще десяток генераций не было желания :)

Kling откровенно порадовал. Это сервис, который в первую очередь прославился как генератор видео, и вот не так давно появилась возможность генерировать и картинки. И что могу сказать - очень и очень достойно. Идея уверенной девушки - царицы на танцполе - уловлена нейросетью очень круто.

Разумеется, победителей в этой подборке нет по определению, но на мой субъективный взгляд, ChatGPT + DALL-E 3 справились на отлично. А все почему? А потому что читеры)) ChatGPT не дословно скормила песню как промт, а проанализировала, сделала выводы кого и как изобразить, и вот что получилось:

DALL-E 3 изобразил "Царицу" в виде девушки на танцполе, но концепции вышли весьма разные. На первой картинке в камеру смотрит уверенная и красивая девушка, изображение скорее фотореалистичное, хотя лица на дальнем плане, как часто бывает, отрисованы не детально.

А вторая картинка акцентирует внимание скорее на характере, изобразив высокомерную холодную девушку и сердце в виде драгоценного камня. Стиль изображения скорее Digital Art, поэтому придираться к реалистичности не будем. Вокруг нее собрались девушки, смотрящие на Царицу с завистью, а также пара парней, один из которых, возможно, попадет сегодня под ее чары :)

На этом все, до новых встреч! Пишите в комментариях, какая нейронка на ваш взгляд справилась лучше, какие еще песни хотели бы увидеть на канале?