Найти в Дзене

Учусь, как генерировать изображения через ИИ. Мой опыт. Шедеврум. Часть 1

Всем привет. В прошлый раз я проверял ИИ на способность писать тексты и создавать интересные сценарии, это у него получилось. Сейчас же я решил посмотреть кое что покруче, а именно создание изображений. _____________________________
Статья 1: Chat-GPT генерирует тексты, идеи и сценарии
_____________________________ Сегодня мы будем пробовать генерировать сообщения через Шедеврум от Яндекса. Шедеврум это такой интересный сайт, где при помощи ИИ можно сгенерировать изображение и при желании его выложить в открытый доступ, чтобы на него посмотрели другие Когда некоторые люди решают проверить, действительно ли искусственный интеллект стал таким умным, они могут проверять ИИ довольно поверхностно. Они могут не уметь правильно пользоваться и не уметь делать правильные запросы. А если постараться и научиться, то можно получить очень хорошие результаты. В сегодняшней статья я буду не просто проверять ИИ на умение генерировать изображения, я буду пробовать учиться это делать, анализировать рез
Оглавление

Всем привет. В прошлый раз я проверял ИИ на способность писать тексты и создавать интересные сценарии, это у него получилось. Сейчас же я решил посмотреть кое что покруче, а именно создание изображений.

_____________________________
Статья 1:
Chat-GPT генерирует тексты, идеи и сценарии
_____________________________

Сегодня мы будем пробовать генерировать сообщения через Шедеврум от Яндекса. Шедеврум это такой интересный сайт, где при помощи ИИ можно сгенерировать изображение и при желании его выложить в открытый доступ, чтобы на него посмотрели другие

Когда некоторые люди решают проверить, действительно ли искусственный интеллект стал таким умным, они могут проверять ИИ довольно поверхностно. Они могут не уметь правильно пользоваться и не уметь делать правильные запросы. А если постараться и научиться, то можно получить очень хорошие результаты.

В сегодняшней статья я буду не просто проверять ИИ на умение генерировать изображения, я буду пробовать учиться это делать, анализировать результаты ИИ, буду искать способы получить более хорошее изображение, учиться на примерах чужих работ, а так же делиться своим опытом, своим процессом обучения и своими эмоциями

Так что, приготовьтесь, статья будет интересной... И длинной.
(Спойлер, к концу статьи я научусь делать крутые шедевры, как на превью вверху)

Мои первые попытки

-2

Вот такой довольно интересный интерфейс нас встречает. Работать мы будем с нейросетью под названием YandexArt версии 2.5. Ребят, это не реклама, честно.

Я хочу сгенерировать камень. Крутой огромный камень какой-нибудь интересной геометрической формы. Объёмная 3д фигура с несколькими гранями, а ещё, чтобы камень казался древним.

Запрос 1: Гигантский камень, многогранная 3д фигура, стоит среди деревьев, очень древний и таинственный. Не круглый, более острые углы
-3

Оу... Результат превзошёл все ожидания. Но я хотел обычный камень, а это статуя какая-то. Очень странно...

Запрос 2: Гигантский пакмен бегает по лесу и ест деревья
-4

Какой ужас... Это пакмен? Это какая-то тыква огромная... Представьте, если вы такое встретите в лесу?

Запрос 3: Гигантский packman из компьютерной игры ходит в лесу и ест деревья
-5

Какой ужас, это что? Это наполовину больной лимон, а на половину M&Ms, который заблудился. Это не то, что я описывал, и не то, что я хотел. Но картинка мне нравится.

Попробую составить запрос на английском, а вдруг сработает?

Запрос 4: Bigest Packman from computer game walking and eating forest
-6

Хаха, какие глазки у него, интересно. Это какой-то зубастый апельсин.

Мне кажется, Яндекс чего-то боится, боится нарушить авторские права и показать нам пакмена. Так, последняя попытка, попытаюсь сделать по-хитрому

Запрос 5: Жёлтый гигантский шар с глазами и ртом поедает всё в лесу. Шар очень похож на пакмена
-7

Даа!! Да, да, да! Получилось!! Я придумал способ, чтобы Яндекс сгенерировал мне изображение Пакмена, не боясь авторских прав. По сути это не пакмен, это большой зубастый жёлтый шар, похожий на Пакмена. Как говориться: "все совпадения случайны".

Давайте что-нибудь интересное. Хочу гигантское зубастое растение, которое выглядывает из леса сверху и поедает всё на своём пути.

Запрос 6: Гигантское зубастое растение выше деревьев, выглядывает из леса сверху и ищет, кого бы съесть
-8

Нейросеть вообще понимает, что такое "выше деревьев"? Тут уже проблема не в том, что нейросеть боится пакменов, а что она меня не понимает. Растение не выглядывает сверху из леса, оно смотрит вверх. ИИ не сгенерировал то, что я от него просил.

Сменим тему.

Запрос 7: Белый анонимус и чёрный анонимус дерутся на мечах в стиле Star Wars
-9

Ого, а это довольно круто. Только вот нейросеть восприняло фразу "дерутся на мечах" вне контекста, и наши "звёздные воины" дерутся на настоящих мечах. Я думал, что будут световые мечи. Но выглядит это всё равно круто.

Исправим это

Запрос 8: Белый анонимус и чёрный анонимус дерутся на световых мечах в стиле Star Wars
-10

Вот. Очень интересная картинка получилась. Только вот вместо чёрного анонимуса Дарт Вейдер. Хахах, ИИ забыл, что я просил чёрного анонимуса и подсунул мне Дарта Вейдера. По-моему, так делать нельзя.

Подведём итоги первых попыток:

1. ИИ пока не совершенный, генерирует картинки и понимает текст не идеально
2. Чтобы сгенерировать то, что защищено авторским правом, можно попросить ИИ сгенерировать существо, которое похоже на (...) (что мы хотим сгенерировать), и описать это существо
3. Иногда ИИ может понимать нас буквально, и в некоторых моментах нужно уточнять.

Пробуем изучать творчество и промпты других

Промпт это запрос, который человек отправляет нейросети. Недостаточно просто написать то, что ты хочешь. Нужно ещё знать, какие использовать слова, чтобы нейросеть тебя лучше поняла. В наше время существуют мастера, которые умеют грамотно применять эти промпты в работе.

Сегодня я не буду искать советы по написанию промптов, я попробую выяснить самостоятельно, как это делается, на основе других работ

-11

У этой картинки довольно длинный промпт. Описан способ съёмки, название гриба на другом языке, очень подробное описание гриба, а так же очень подробное описание окружающей среды

Если что, я не присваиваю результаты чужого труда, в моей статье рассматриваются другие работы исключительно в образовательных целях. Автора работы видно на скриншоте

Посмотрим следующую

-12

Тут тоже очень подробно описана картинка, способ рисовки, а так же написано, какую именно панду нарисовать, панда от автора Рикуто. Тоже очень большое описание, двигаемся дальше

-13

Мне очень понравилась эта женщина, довольно милая. В промпте подробно описан стиль картинки: год, стиль рисования, цвета картины. Тут не везде написано "стиль" или "цвета картины", просто написано "пуантилизм", "бежевый", "белый", "голубой" и так далее...

Можно писать отдельными словами, нейросеть поймёт. Не знаю, будет ли дополнительной нагрузкой и путаницей для нейросети, если написать "цвета картины: белый, голубой..."

Пуантилизм — направление в живописи, основанное на использовании точечных мазков для создания изображения. Название происходит от французского слова point — «точка».
-14

Здесь автор промпта тоже не пишет много связного текста, он использует отдельные слова. Возможно, это как-то влияет на нейросеть...

-15

В этом примере в промпте несколько раз повторяются одни и те же слова, а именно "аниме", "арт", "стиль". Возможно, повторение слов как-то влияет на результат, если бы нейросеть понимала с первого раза, автор не повторял бы их в промпте по нескольку раз

-16
-17

Так, на картинках с роботами можно закончить

Подведём итоги наших поисков:

1. Запросы нужно писать более подробно и развёрнуто
2. В запросах нужно использовать разные слова, которые точно описывают предмет, композицию, стиль изображения и способ съёмки. Нужно найти хорошие слова для описания: детализация, минимализм, аниме стиль, рисовка красками, стиль 1960-ых, стиль автора (...), атмосфера, стиль. Нужно найти наиболее подробные и подходящие слова
3. Важное качество стоит написать два или несколько раз (насчёт этого точно не знаю)
4. Можно попросить сделать изображение, которое похоже на что-либо из жизни. Например, похоже на стиль какого-либо автора, или, как я делал, шар, похожий на пакмена.
5. Стоит писать больше отдельными словами, возможно, нейросеть плохо понимает склонения и связи между словами

Это мои итоги, что я понял самостоятельно. А теперь приступим снова к генерации изображений.

Снова генерируем изображения

Запрос 9: Много муравьёв, сражение, Дарт Вейдер, лазерные мечи, маленький, уменьшился, микромир, сьёмка с высоты, масштабный бой, жизнь, много муравьёв, StarWars, возле муравейника, маленький Дарт Вейдер, битва, муравей дерётся лазерный меч, атмосфера
-18

Хаах, это что? Лего Дарт Вейдер? Мне кажется, муравьям всё равно, сражаться они не хотят. Если они и сражаются, то скорее с ним, а не против него, это странно. Попробую перегенерировать...

Запрос 10: Много муравьёв, сражение, Дарт Вейдер, лазерные мечи, маленький, уменьшился, микромир, сьёмка с высоты, масштабный бой, жизнь, много муравьёв, бегут на него, атакуют, агрессия, StarWars, возле муравейника, маленький Дарт Вейдер, битва, муравей дерётся, злые муравьи, защищаются, окружают, лазерные мечи, человекоподобные, атмосфера
-19

Вот, это уже что-то стоящее. Только вот агрессии мало. У муравьёв вроде уже появились лазерные мечи, и в них уже не так много безразличия. Действительно чувствуется опасная обстановка. Но не хватает пафоса, напряжённости, муравьи смотрят в разные стороны. Один как будто действительно заинтересован в битве, а другой с пола что-то ест...

Сменим тему...

Запрос 11: Гигантский человечек, похож на фиксика, Нолик, большой, ломает здания в городе, разрушения, фиксик гигант, ломает, пыль, гнев, пафос, 21 век, вертолёты, злость, большой человечек в синем комбинезоне, с синими волосами, как Нолик из фиксиков. Кулаки, ломает
-20

Странно. Какой-то мужик получился, а я хотел Нолика из фиксиков. Ему не достаточно сказать "как Нолик из фиксиков", ему его прям описать нужно, так боятся за авторские права. Только вот на Дарт Вейдера им всё равно.

Запрос 12: Гигантский человечек, похож на Нолика из Фиксиков. Мальчик, синие волосы, синяя одежда, голубая кожа, добрый взгляд. Ломает здания в городе, гигантский. Апокалипсис, красное небо, пафос, кулаки, разрушения, многоэтажки, прикол. Низкий рост, но гигантский. Супер сила
-21

Хаах. Я придумал новый сюжет для Фиксиков. Нолик разозлился, стал большим и забыл своё предназначение фиксика. Начал не чинить, а всё ломать, а остальные пытаются его остановить))

Забавно, конечно, только вот нейросеть отказывается мне генерировать Нолика, я третий раз пробую уже. Я его максимально подробно описал, но ИИ не хочет делать ему голубую кожу. Настолько боятся за авторские права. В целом похож чем-то на Нолика, но не совсем.

Запрос 13: Гигантский робот паук, детализация, в городе, мирный, серые цвета, рисунок, мирное сосуществование, ходит, бродит, лёгкий туман, напряжённая атмосфера, технологии, пустота, пустые улицы, 20 век, индустриализация
-22

Ух, страшно. Я представлял это более мирно. Надо было более подходящие слова подбирать.

Давайте что-то более приятное сделаем.

Запрос 14: Человек убегает, удивляется. Много милых нежных роботов, нежные синие экраны, бегут, догоняют. Человек убегает, милые роботы, безумие. Улица, милая локация
-23

Хахахах, забавно!! Очень интересно получилось, пробуем дальше.

Запрос 15: Гигантский милый круглый робот сидит в городе, возвышается над многоэтажками. Нежный синий экран. Маленькая летающая корона над головой. Мания величия. Милый робот отдаёт всем приказы, важно сидит, вытягивает указательный палец. Летают маленькие корабли будущего вокруг. Милый робот, большой, город маленький. Милый стиль. Светлые, голубые, зелёные цвета. Немного растений внизу. Рисунок
-24
Запрос 16: Гигантский милый кругловатый робот сидит в городе, возвышается над домами. Нежный синий экран. Маленькая корона на голове. Мания величия. отдаёт всем приказы, важно сидит, сидит сидя, вытягивает палец. Летают маленькие корабли будущего вокруг. Робот большой, город маленький. Дома плотно вокруг, город. Милый стиль. Светлые, голубые, зелёные цвета. Немного растений внизу. С большой высоты, далеко, вид сверху. Все вокруг него бегают и служат. Сидит под углом 45 градусов внизу под башней на траве.
-25

Воо, как я и задумывал, почти. Только со средневековыми домами мне нравится больше, так даже лучше получилось.

Запрос 17: Большие кубики рубика, много, куча. Разобранные, белые, синие, красные цвета. На улице, поле усеяно кубиками. Кубики 3 на 3. Кубики улетают в космос, улетают под углом 45 градусов вбок. Некоторые из них светятся. Красиво
-26

Хахахахахахахаххаххахахахахахах, ахахахахахахахахах, вы только посмотрите на это, какая красота!! Хахахахах, до чего техника дошла. Меня натолкнуло это на новую идею...

Запрос 18: Луг, большое пространство, далеко сбоку деревья. Строится большой дом, только стены есть. Строится дом из гигантских кубиков рубиков. Кубики ломают и добывают из них блоки кирпичи. Белые, синие, красные цвета, преимущественно белые. Поле усеяно гигантскими кубиками рубиками, часть из них улетает в небо под углом 45 градусов. Большая территория, вид с высоты птичьего полёта сбоку. Готовы только стены, много интересных стен без крыши, дырки для окон. Очень много кубиков рубиков на заднем плане
-27

Стройка какая-то, дворец строят)) Хотя больше похоже на детский сад в поле. Признавайтесь, кто красоту построил??

А ведь и в реальной жизни такое построить можно, и для красоты вокруг поставить кучу гигантских кубиков. Какой-нибудь развивательный образовательный центр

Запрос 19: Город будущего, много высоких домов, но построены они из досок. Доски криво прибиты, отваливаются. Некоторые дома ломаются и падают. Один из домов падает и завалился на 45 градусов. Летающие корабли. Вид сверху, большие окна. 2100 год, пользуются досками и гвоздями. Фотография, реализм, технологии
-28

Ухх, жесть какая. Как вам такая антиутопия? Весь мир резко начал пилить деревья, отказался от бетона и начал делать ужасные дома, полностью забив на все инструкции, после чего постройки начали рушиться... Такое мог придумать только я, безумец.

Запрос 20: Дарт Вейдер встал на сторону Яндекса. Он поменял свои доспехи, он в белой броне, белой маске, белом плаще, весь белый, как штурмовик. На груди у него логотип Яндекс, белый круг, в центре которого красная буква "Y", в руках красный световой меч. Дарт Вейдер стоит на своей базе, сзади него сражаются джедаи и ситхи
-29

Это просто шедевр!! Я в восторге!!! Я даже это чудо готов поставить на превью этой статьи (хотя хотел картинку с кубиками рубиками).

Чтобы сгенерировать эту картинку, мне пришлось постараться. Нейросеть не хотела вставлять логотип Яндекса, мне пришлось пойти на хитрость, заставить её нарисовать букву "Y" красного цвета на Дарт Вейдере в доспехах белого цвета. Я 7 раз пытался сгенерировать это, чтобы получить такой шедевр. Хоть бы Яндекс меня не забанил, пожалуйста, прошу. Сделал в Шедевруме от Яндекса и написал об этом в Дзене от Яндекса...

Подведём итоги:

И так, сегодня мы неплохо потрудились. Какие выводы я сделал по работе с нейросетями, которые генерируют картинки:
1. Нужно писать описание максимально подробно. Нейросеть не понимает простых вещей, её нужно всё подробно объяснять, что вы от неё хотите
2. Нейросеть не может сгенерировать некоторые популярные образы или логотипы, поэтому нужно придумывать пути обхода, пытаться объяснить ей, как нарисовать это. Есть страх нарушить авторские права.
3. Нейросети нужно писать простыми предложениями и отдельными бессвязными словами.
4. Нейросеть не совсем тупая, она может генерировать сложные вещи, но ей нужно подробно объяснять, какие именно вещи мы от неё требуем сделать
5. Писать промпты для нейросетей это тоже интеллектуальная работа, ей тоже нужно учиться. Да, не такая тяжёлая, как реальный труд фотографа или художника, но тоже нужно постараться

Я очень не хотел делать поверхностных преждевременных выводов, как другие авторы, которые только зашли на сайт к нейросети. Я хотел изучить этот вопрос подробно.

Сегодня я убедился, что тут то же самое, что и с Chat-GPT. Люди пытаются делать из него собеседника, пытаются генерировать какие-либо произведения, стихи, и получается не всегда хорошо, они разочаровываются. Но нужно найти подход, чтобы получить наилучший результат из возможного. Нужно глупенькой нейросети объяснить во всех подробностях, что от неё требуется. Так-то она может, просто сама догадаться, как нужно, не может.

Если эта статья залетит в рекомендации, буду делать вторую часть.