Так... больше картинок - меньше текста! Почему? Да потому что для описания всего моего пути знакомства с нейросетями, моего впечатления, трудностей, с которыми пришлось столкнуться, бубна, в который мне пришлось бить, мне понадобится три дня и 100 страниц текста))) Слишком много всего хочется рассказать.
Поэтому я решила избивать себя пока от этой ноши, и отложить это "на потом". А этот пост сделать чисто визуальным (ну, почти).
И пока страсти христовы по второму сезому Good Omens не утихли, я покажу вам, какую красоту я нагенерировала при помощи двух нейронок - Stable Diffusion и Leonardo. Без какого-либо длительного опыта работы в них до этого момента.
Кто ещё не читал мой большой эмоциональный рассказ про впечатления от финала второго сезона Благих знамений - бегом сюда.
А кто читал - рада видеть вас снова!))
Зачем это всё? И где Midjorney?
Итак, пару слов о том, как я дошла до такой жизни.
Да всё просто.
Долбанулась копчиком о жёсткое кожаное седло Brooks на вело-покатушке и теперь не могу заниматься разными активностями (походы, ролики, велик, скалодром, плавание), и с грустью наблюдаю, как остаток лета утекает из моей жизни... А учитывая, что я всё лето проработала и никуда вообще не выбралась, не считая одного мини-водного походика на байдарках и одной вылазки в Москву, то я решила что это знак свыше (благое знамение))) и надо браться за творческие проекты, которые висят и не хотят никак доделываться. Читай - сидеть за компом всеми днями, иногда отвлекаясь на прогулки и гитару.
А нейросети я начала изучать ещё весной 2023 года, чтобы создать иллюстрации к моей книге стихов. Начала конечно (!) с Midjorney 3 и 4 версии, сразу впала в дикий восторг и азарт, пыталась генерировать Ремуса Люпина, но выходил ужас, в связи с чем я поняла, почему моего любимого персонажа нет ни в одной подборке, начинающейся со слов "Героев Гарри Поттера запихнули в советскую столовку/киберпанк мир/аниме/средиземье и т.д...."
Потом потратила все бесплатные попытки в Midjorney, потом "хакала" систему чтобы получить ещё бесплатных попыток, потом лавочку прикрыли, потом один заказчик оплатил мне аккаунт иностранной картой, потом у меня опять закончилась подписка и ... вот теперь я не могу оплатить никак... там проблемы какие-то у всех. Короче, выход один - создавать новый аккаунт. Или?...
Правильно! Изучать другие нейросети!))
А я же не простой гик, я повёрнутый гик, я сама чиню комп, когда он ломается (пытаюсь по крайней мере)) и знаю что такое "диспетчер задач" и командная строка XDD
Ну а ещё я 3д-визуализатор, но это так, к слову.
Leonardo ai
В общем, я решила попробовать нейронку Леонардо. И знаете что? Я была офигеть как удивлена. Она гипер понятная, супер удобная, интерфейс делал будто сам боженька. А ещё её не надо устанавливать, она не требует от тебя крутого железа. Она даже проще чем Миджорни. А результат там получается, на мой взгляд, очень крутой. И это я только вторые сутки с ней играюсь! Вторые сутки, Карл! А если там полазить и поизучать все модели.. м-м-м... Какой потенциал!
Stable Diffusion с видеокартой AMD Radeon RX6600
Где-то три месяца назад я уже пыталась что-то генерить в онлайн-версии Stable Diffusion... по тематике велосипеда и Яндекс-Курьера. Но.. это получилось так жёстко и так... ну, знаете, в стиле Кандинского и Малевича, что мысленно я поставила крест на изучении этой нейронки, хотя и понимала что именно она на данный момент обладает самым крутым гибким методом генерации и потенциалом.
Но всякий раз, стоило мне начать читать ИНСТРУКИИ на 10 страниц о том, как установить её на комп и заставить работать с видеокартой AMD, я впадала в дикую лень и отчаяние и... забивала на это.
Ну и вот... у меня болит копчик, я сижу дома, у меня в работе затишься... Не пора ли вернуться к незакрытому гештальту со Stable Diffusion? Дыа!
Десятки просмотренных роликов Ютуб, дюжина прочитанных инструкций... Правка кода, отчаяние и злость, восторг и радость.
Дальше я промолчу. Кхм.. Размер бубна, в который мне пришлось бить, чтобы всё заработало, превосходит размер офигевания от финала второго сезона GO ))). Не хочу закапываться в детали, скажу только что это не для слабонервных. И чёрт меня дёрнул при апгрейде компа прошлой осненью купить видеокарту AMD, а не NVIDIA. Ух... Вот тупанула так тупанула)) Учитывая, что я ещё и тридэшник. Мдаа... Ну не суть. Всегда можно поменять.
Короче, я провозилась с ней целый день, установила репозиторий, гит хаб, пайтон (эти у меня уже три месяца назад стояли), скачала обученные модели для генерации, в общем, всё по фен-шую... И оно у меня всё равно выдавало ошибки о нехватки видео-памяти. 8 Гб ей было мало. Я правила блокнот, батник запускной, дописывала туда аргументы... тщетно. Получалось генерить только миниатюры плохого качества. В итоге я плюнула и легла спать. На следующий день, то есть вчера, я снова её запустила и... она как-то долго запускалась. Я тут я поняла, что оно мне что-то ДОустанавливает. Само по себе!)) Я офигела, открыла и снова попыталась генерировать в ней картинки. И что вы думаете? Оно всё нормально заработало! Можно сказать, нейронка пофиксила* сама себя XDD
*пофиксить = починить
И тут Остапа понесло! (с)
Я не могла остановится)) Ещё бы! Такой мощный инструмент в моих руках! И никаких ограничений. Только сиди по 15-30 секунд и жди, когда появится картиночка...
В общем, вчера я приручила Stable Diffusion как ретивого коня! Ну правда. Были именно такие ощущения. Будто он сдался под моим напором энтузиазма и упрямства))
И знаете что? Stable Diffusion - это и правда огромный интересный космический корабль с пультом управления не хуже чем в звуковой студии и возможностью сменить курс в любую сторону галактики и за её пределы. Тогда как Midjorney - это, скажем, лишь маленький шаттл, везущий тебя по заранее вбитой траектории. Но красивый и приятный шаттл)) А Леонардо - вообще что-то среднее и ооочень нуждается быть изученным! Пару дней покрутить настройки - это очень мало, чтобы понять суть.
Итак, я обещала вам только картинки, а сама опять не могу остановиться рассказывать буквами))
В общем, вчера я провела весь день за генерацией наших любимых персонажей - Кроули и Азирафэля - в космическом сеттинге!
Почему именно космос?
Ну, по-первых, я в детстве мечтала стать космонавтом.
Во-вторых, я фанат Стар Трека 60-х годов Джинна Родденбери.
В-третьих! На просторах интернета мне как-то случайно попался один интересный промпт (набор слов, запрос для нейросети) для портрета человека в крутом современном скафандре.
Выглядел он вот так:
Мне он понравился. Я его скопировала и решила попробовать применить на примере Девида Теннанта и Майкла Шина. Убрала лишнее, дописала своё... Короче, экспериментировала как могла. Часов восемь с этим вчера сидела))
Всё. Дальше описывать подробно не буду. Поехали смотреть картинки)
Вот эти две меня поразили до глубины души! Такой образ вышел...
Покажу вам почти всё, что получилось, а также то, что НЕ получилось)) Всё это без фотошопа, так сказать первые наброски. Потом, думаю, я выберу самые крутые кадры и сама "дорисую" - например, жёлтые глаза, может ещё что-то... где-то уберу лишний палец, где-то исправлю взгляд. И тут мне нужна ваша помощь. Пишите в комментариях, какие картинки вам понравились и вы хотели бы видеть их доработанными.
Мои запросы (промпты) были примерно такого содержания (менялись лишь детали, настроение, цвет и негативные слова, то есть отрицительный запрос)
"a portrait of a futuristic man-astronaut looks like David Tennant from Good Omens, with a sleek and advanced spacesuit and equipment with glowing stripes, inspired by movies like Star Trek, The portrait should highlight the the astronaut’s courage, curiosity, and sense of adventure, soft warm light on the side, 3d render, octane render, intricately detailed, cinematic"
И такой для Майкла (тоже меняла в запросе много чего потом - от цвета волос до настроение и предметов):
"a portrait of futuristic man-astronaut looks like Michael Sheen as Aziraphale, with blue eyes, a sleek and advanced white color spacesuit, holding a book in hand, The portrait should highlight the astronaut’s courage and sense of adventure, soft warm light on the side, 3d render, octane render, intricately detailed, cinematic"
Кстати, ради интереса, сегодня попробовала вбить такие же запросы в Леонардо. И вот что он мне выдал! Тоже вау! Образ Майкла шина прям почти одинаковый - что тут, что в SD, такой, немного стилизованный)
В этих запросах я забыла прописать светлые волосы и он красил их в тёмный))
Видите три картинки выше? Это я прописала в негативном запросе "поменьше курдряшек"! И он их убрал вообще. Считаю, без кудряшек из Майкла Шина получился весьма колоритный капитан космического корабля.
Ой, ну не могу)) Как же офигенно обе нейронки улавливают черты лица и передают их.. пусть по-своему, но так круто и художественно.
Вот, можете посмотреть детальнее картинки из "Леонадро". Листайте вправо, их там много.
Хочется бесконечно благодарить всех CG-художников, на чьих работах обучались нейросети! Я ведь тоже художник, чего уж (с художественным образованием, художка, колледж, потом вышка)) Правда давно не рисовала... всё музыка да походы... Но не суть. Хочу обратиться ко всем художникам и сообщить, что некоторые люди вас очень ценят и понимают, что именно благодаря вашим рисункам и артам мы имеем сейчас возможность получать такие шикарные результаты при генерации изображений в нейросетях. Аригато годзимасу!
Просьба при использовании материалов отсюда - оставлять ссылку на эту статью.
Но вернёмся к Stable Diffusion
Вот тут мне очень нравится третья картинка, но с неё срочно надо убрать чёрную маску. Не понятно, почему она там получилась)) Попробую это сделать в ближайшие дни. Если статья найдёт отклик у зрителя - буду продолжать креативить)
Вот тут тоже неплохо, Доктор Кто прослеживается) Но надо фотошопить, либо перегенерировать частями. Ибо глаза под очками в первом кадре - это ни в какие ворота)
Тут без комментариев) Красота... Причём Теннант прослеживается везде: где-то косвенно, а где-то более точно.
А ниже я показываю скрины из SD (Stable Diffusion), где пытаюсь заменить очки и цвет костюма. Не очень успешно, правда...)) Зато опыт получила бесценный!
И ещё немного первых генераций Азирафэля. С разными эмоциями на лице. Листайте вправо.
А до того, как начать делать Азирафаэля и Кроули, я тренировалась на других персонажах, а точнее на музыкантах. Девид Боуи, Пол Маккартни, Джордж Харрисон, Бенни Андерсен, Бьёрн Ульвеус! Поделюсь с вами тем, что у меня получилось. Можно сказать это вообще самые ПЕРВЫЕ мои адекватные поделки в SD силами моего компа и моей собственной видеокарты.
Эх.. хотелось бы мне работать в таком экипаже на космическом корабле))
David Bowie. Листайте вправо.
Джордж Харрисон, Пол Маккартни, Бьёрн Ульвеус, Бенни Андерсен
Кстати, кому интересно, как происходит генерация в SD, то вот. Она начинается с такого цветного "шума". Прямо как рендер в тридэ-графике) По сути в "Миджорни" - то же самое. А "Леонардо" не показывает процесс генерации, но я думаю, что где-то в его настройках это можно изменить и скорее всего там тоже в основе лежит случайное облако шума.
Но вернёмся к нашим героям!
К ангелу и демону))
Один раз я забыла прописать, что мне нужен именно "мэн-астронавт", а не просто "астронавт". И нейронка решила, что из Девида Теннанта выйдет прекрасный вумэн)) Серьёзно, я не специально! Она сама так нарисовала)) Листайте вправо.
На последнем кадре он конечно не похож на женщину, да и на щеке какой-то артефакт. Зато улыбка какая милая! Улыбку я отдельно прописывала в запросе.
Помятуя "счастливый" конец второго сезона GO, я смотрела на все эти картинки и в голову мне начали приходить мысли, что по всему этому космическому сеттингу можно написать кучу крутых фанфиков)) Только, пожалуйста, не надо превращать Кроули в женщину!)
Так. Движемся дальше... А дальше я решила добавить пару вещей в кадр. Например, книгу. И кадр сразу сам расширился. Портрет стал более дальним. Что мне лично очень понравилось!
На некоторых кадрах Азирафаэль получился ну прям вылитый капитан высший Архангел всего Рая!
Ну или если не капитан, то какой-нибудь Высший советник уж точно! Здесь даже пальцев нормальное количество! По-моему тут как раз я прописывала в негативный промпт "шесть пальцев". Чтобы нейронка точно их посчитала лишний раз))
А эту надо фотошопить либо генерить частями отдельно при помощи того же SD. Тут шесть пальцев и глаз поехал, увы. И нос и лоб мне не нравятся.
А следующую мне пришлось немного подфотошопить - исправила косые глаза и немного пластику лица.
Продолжаем...
Кстати, подпишитесь и поставьте лайк, пока не забыли!)
Безумная улыбка Кроули!
Во время написания этой статьи мне пришло в голову попробовать воссоздать знаменитую улибку Кроули, с зубами. Я вбила одинаковые запросы в Леонардо и в Стэйбл. Леонардо лучше справился с зубами, а Стэйбл, похоже, вообще зубы проигнорировал, зато характер и узнаваемость персонажа у него лучше.
- Результаты Леонадро
1. С выключенной галочкой "Alchemy", которая тратит больше "токенов" на одну генерацию.
2. С включенной галочкой "Alchemy". Костюм тут шикарный, а образ персонажа, увы, совсем изменился.
- Результаты Stable Diffusion
SD лучше улавливает образ. Жёлтых глаз только не хватает) И костюм он упорно делает с белыми вставками. Но можно дописать в отрицание "белый цвет" - и он его не будет использовать. А вот "жёлтые глаза" обычно плохо срабатывают...
Кстати, хочу заметить, что при создании всех этих изображений я ни разу не использовала фото-референсы. То есть это всё нейронка создаётся чисто по описанию. Ну, в данном случае ей не сложно, так как фотками этих двух актёров завален весь интернет и фотки эти довольно качественные))
Запрос для кадров выше был такой:
"a portrait of a futuristic man-astronaut looks like David Tennant from Good Omens with red hair, mad smile with teeth, wearing a sleek and advanced black spacesuit and equipment with glowing stripes, inspired by movies like Star Trek, The portrait should highlight the the astronaut’s madness, joy, inspiration, soft warm light on the side, 3d render, octane render, intricately detailed, cinematic"
Отрицательный промпт: "American flag"
Зачем я везде пишу в отрицание "американские флаг"? Да потому что в самом начале, когда я только испытывала этот промпт, он мне выдал это:
Поэтому я решила сразу прописать в негативном промпте (отрицательном запросе) флаги, эмблемы и т.д. Но на удивление хватило одного упоминания американского флага, и он убрал любые флаги))
А это SD нарисовал после того как я добавила в промпт запрос на дьявольские рога и огонь)) Рога и огонь не сделал, но зато зубы немного показались! И костюм стильный чёрный!
Ещё в самом начале у меня были вот такие девушки-астронавты) Именно после них мне пришло в голову надеть этот костюм на Майкла Шина. А где Шин, там и Теннант)) Ну и пошло-поехало...
После одной из этих девушек и появился первый Теннант-астронавт))
А вот задумчивый Азирафэль. Например, в конце второго сезона, через 5 минут после выхода из лифта в Раю. "Правильно ли я поступил? Что теперь будет?"
И ещё пять картинок милого ангела)
Парный портрет =)
Ну и потом я конечно же попробовала ради эксперимента самое страшное и сложное, что можно только придумать для нейросети. Парный портрет двух известных персонажей. Я ещё при работе с Миджорни поняла, что это бесполезная затея, когда пыталась сделать красивый арт с Люпином и Снейпом в одном кадре, пьющими чай)) Но меня ждал полный провал, хотя некоторые кадры получились ничего, кроме Люпина - он нигде не похож. Но тут я их показывать не буду. Пишите в комментариях, если вам интересно это увидеть. Возможно я напишу отдельный пост.
Короче, я ещё тогда поняла, что парная композиция из двух и более человек - это для нейронок пока сложно. И что легче генерировать по-отдельности, а потом совмещать.
Нооо... мне было любопытно, что сможет сделать SD ))
И.. вот! Кроули и Азирафэль)) Ахахаах. Какой-то странный на нашем корабле экипаж... Однако. Таким костюмам позавидовали бы музыканты группы ABBA =))
Потом я решила пойти дальше, замазать часть картинки с Кроули специальными средствами SD, и попробовать заменить её на... другого Кроули)) И развернуть его лицом к камере. И убрать слишком близкую близость друг к другу)) Но... космическим кораблём не так-то просто управлять! Этот инструмент требует отдельного вдумчивого изучения. Там слишком много "переменных", от которых зависит ВСЁЁЁ. Ну короче вы поняли - даже нейронки шипперят этих двоих))
Ниже я всё-таки покажу, как я пыталась изменить картинку средствами SD и что из этого вышло. Слабонервным не смотреть))) Листайте вправо - там будет всё хуже и хуже.
И ещё три штуки, уже получше)
И ещё немного креатива)
А тут я пыталась заменить цвет скафандра Теннанта с белого на чёрный) Эту задачу у меня получилось решить весьма неплохо средствами SD.
А давайте ради научного интереса теперь пропишем парный портрет в Леонардо. У меня как раз осталась пара токенов на сегодня, так что я могу их потратить. Токены обновляются каждый день, так что мне не жалко))
Итак, мой запрос:
"a portrait of a futuristic mans-astronauts looks like David Tennant and Michael Sheen from Good Omens, wearing a sleek and advanced spacesuit and equipment with glowing stripes, inspired by movies like Star Trek, The portrait should highlight the the astronaut’s joy, inspiration, soft warm light on the side, 3d render, octane render, intricately detailed, cinematic"
Отрицание: "American flag, romantic, love"
И вот что получилось! Вау, а неплохо)) Красиво по цвету, по анатомии отлично! Очень мило)
Причём заметьте - у обоих персонажей есть черты друг друга. Это прям круто! Не то, что я хотела увидеть, но это даже круче! Вот за это я и люблю нейронки)) В 80 % случаев они дают тебе совсем не то, что ты хочешь увидеть, но взамен они дают тебе что-то бОльшее! И новые идеи и вдохновение) И маньячность. Оторваться просто невозможно.
Так-с, ну-ка... Добавила в запрос: "one of them have red hair, and another one with gray hair". Посмотрим, поймёт ли он меня)) Думаю, Леонардо будет очень сложно.
Оооо, а что! Кстати, весьма неплохо) Про волосы он меня понял) Хотя... он просто разделил героев на две части картины. Нее, это халтура. Так не пойдёт.
Думаю, нужно написать части запроса отдельно по актёрам, чтобы каждый персонаж был описан отдельно. Поскольку сейчас он смешивает образы двух актёров в обоих героях.
Но у меня осталось мало попыток на сегодня в Леонадро. Так-с... Что мы пишем...
"a portrait of two futuristic mans-astronauts together, one of them looks like David Tennant with red hair and another looks like Michael Sheen with gray hair. They are wearing a sleek and advanced spacesuit different colors, inspired by movies like Star Trek. The portrait should highlight the the astronaut’s joy, inspiration, soft warm light on the side, 3d render, octane render, intricately detailed, cinematic"
Неее.. тут у бедной нейронки совсем вынесло мозг)) Даже хочется перед ней извиниться за такой запрос)
А что если добавить в качестве промпта изображение, кадр из фильма? В Леонардо, я имею ввиду. Кстати сегодня я пыталась из своей фотографии что-то сделать, тоже космическое, но всё вышло не похоже.
Итак. Я закинула в Леонардо вот этот кадр из фильма.
И написала вот такой запрос, удалив из него лишние детали.
"a portrait of two futuristic mans-astronauts together, one of them looks like David Tennant with red hair, another astronaut looks like Michael Sheen with white hair. They are wearing a sleek and advanced spacesuit different colors, inspired by movies like Star Trek. 3d render, octane render, intricately detailed, cinematic"
Влияние картинки поставили на 0,8, а влияние промпта на 0,4. Модель оставила ту же - DreamShaper V7.
И получилось вот что))
С другой картинкой-референсом получилось ещё хуже.
Так, ладно. Я уже устала писать этот длиннющий пост. Тем более это мне ещё столько всего предстоит изучить по методам работы с генеративными нейросетями, интересно же! Наверняка в том же Леонардо есть уйма всего, о чём я не знаю и что поможет мне добиться более точного результата. В общем, на сегодня всё. Я усталь)) Буду закругляться.
Если вам понравилось - ставьте лайк и подписывайтесь.
Пишите в комментариях, какие картинки произвели на вас впечатление, и возможно я с ними ещё поработаю)
Всем хорошего дня, вечера и доброй ночи.
Живите долго и процветайте!
____________
Бонус от Midjorney
Ох, ну ладно)) Покажу вам ещё старые попытки сгенерировать этих двоих при помощи Миджорни)) Это было 3-4 месяца назад.
Всё, теперь точно конец статьи! Фух...!
P.S. Друзья, если будете тырить картинки - просьба ссылаться на эту мою статью либо упомянуть моё имя в вашей публикации.