Ой, sorry, sorry! Это не Роджер о нейронках, а нейронные сети о нём. Вернее, о его, наверное, самом известном произведении «Хроники Эмбера».
С большой натяжкой сюжет книги с чисто человеческой, понятной точки зрения, похож на интригу сериала «Игры престолов». Но Хроники гораздо глубже, с магией и перемещениями в пространстве-времени, на фоне глобальной темы добра и зла. И написаны они были за много лет до фильма.
Скорее, «Игры престолов» создавались «по мотивам» Хроник.
Однако, начнём с начала.
Начало
Давным давно, после распада Союза, в эпоху жесточайшего голода по приличной и интересной литературе и огромнейших очередях в книжные магазины, как грибы стали появляться самопальные переводы известных зарубежных произведений. Мне посчастливилось купить «Хроники Эмбера» Роджера Желязны, половину его десятикнижия, посвященной Корвину. И несмотря на просто безобразнейшее качество и перевода, и самого типографского издания, эта вещь меня зацепила.
Мне довелось устроиться на работу в СП с американцами. Причём, моя не совсем рядовая должность давала мне право попросить коллегу, работавшего со мной в отделе, во время своего очередного R&R (отпуска на родину) купить для меня эту серию книжек.
Английский мой был тогда ещё не очень хорош, но даже он дал мне возможность оценить не только простоту, но также мощь и сочность языка Желязны в оригинале. Бедные наши читатели, радовавшиеся низкопробному переводу…
Уже прошло много лет, а я до сих пор храню эти книжицы, бережно обернутые в плотную бумагу, чтобы не пострадали обложки с великолепными иллюстрациями из эпопеи. Время от времени перечитываю.
Эмбер в эпоху наступающей эры нейронных сетей
Когда я вплотную занялся нейросетями, генерирующими изображения, мне дико захотелось увидеть те, еще живущие в мозге воображаемые картинки так, как смогут их показать нейронки.
Начал я, конечно, с самого простого. С Арденского леса.
Напомню, что есть целый ряд нейросетей, генерирующих изображения. Самые известные из них - Midjourny, Stable Difusion и DALL-E. На вход им нужно подать текстовое описание (промпт) того, что хотим получить. При этом, предпочтительнее это делать на английском, потому как это язык создателей нейронок. Некоторые сети принимают и русский. Но, понятно, тут вмешивается качество перевода, и каким бы он качественным ни был, играет он в худшую сторону.
Поэтому промпт для картинки леса я составлял, сильно порезав куски текста английского оригинала, описывающего деревья. Чтобы правильные слова были. Дословно это звучало примерно так:
«Дремучий дикий лес с огромными могучими и величественными соснами, дубами и кленами, с листьями глубокого, насыщенного зеленого, слегка тронутого золотом, цвета».
Вот, что выдала нейросетка Stable Diffusion.
Здесь есть очень много от того, что указывалось в промпте. Но нет дикости, дремучести и таёжности. Попытки добавить эти свойства привели к такому результату:
Это стало больше похоже на дорожку в каком-нибудь городском парке. Но дальше улучшать не стал. Мне было интереснее другое.
Корвин – самурай
Описание внешности Корвина пришлось бы долго искать. И мне больше поначалу ничего не пришло в голову, кроме как изобразить его самураем.
Для получения картинки выбрал самую разрекламированную нейросеть Midjourney.
Результат не порадовал. Нейросеть всё не хотела давать Корвину-самураю меч, его японскую катану. Вот максимально чего удалось достичь.
Сетка всё больше изображала Корвина этаким мыслителем.
Потом я узнал, что Midjourney плохо транслирует текстовое описание в картинку. Из-за этого от неё трудно добиться такой детализации, какую заказываешь в промпте. Зато недостаток понимания нейронка с лихвой возмещает своей достаточно однообразной фантазией.
Корвин, Лорд Эмбера
Зато другая, менее известная, но гениально простая, нейросеть Recraft почти сразу же выдала картинку, очень похожую на искомую.
Здесь я заказывал лордов Корвина и его визави Эрика, а также королей Ганелона и Рэндома.
Но больше всего хотелось показать Корвина и Лабиринт.
Корвин, проходящий Лабиринт
Решил применить нейросеть Stable Diffusion, одну из тех, что лучше всего понимает промпт. Не найдя на английском описания одежды лордов-эмберитов, заказал Корвину одеяние ковбоя.
Вот в нём он как раз и проходит. Только не Лабиринт, а по какой-то дорожке. А по краям свисают ленты разноцветной материи, видимо, означающие полосы спиралей Лабиринта.
Ладно, думаю, дело – в качестве промпта. Поэтому сделаем проще – возьмём пока только Лабиринт, без Корвина.
Лабиринт Эмбера с Stable Diffusion
В результате получилась какая-то спираль!
Понял, что не указал угол, под которым нужно смотреть. Модифицировал промпт, намного подробнее расписав, как нейронка должна была построить спиральный лабиринт и как его показывать.
Результат был абсолютно не ожидаемым:
С досады я забросил на время дальнейшие попытки. Решил взять другую нейросеть.
И только сейчас, при написании статьи и повторном анализе промпта, я увидел, что Stable Diffusion — умничка! Она всё нарисовала как диктовал промпт! Вот только описание получилось двусмысленным. И нейронка изобразила тот смысл, который увидела сама.
Лабиринт Эмбера с BlueWillow
Выбрал нейросеть BlueWillow, заставил её пройти тест на рисование спирального лабиринта. Вот что получилось.
Поначалу я разочаровался. Не увидел спирали. Однако, посмотрев внимательнее на промпт, понял, что спираль в нём не указана. Как и угол, под которым следовало смотреть. Но переделать не успел.
А сейчас, глядя на картинку, мне кажется, что результат очень даже неплох. Если только не требовать, чтобы лабиринт был спиральным.
Получилась наглядная иллюстрация того, как много зависит от правильного составления описания. И ещё долго только-только нарождающаяся профессия промпт-инженера (как я упоминал здесь) будет востребована. Несмотря на появившиеся системы автоматической генерации промптов.
Лабиринт Эмбера с Leonardo AI
Последний свой эксперимент с Лабиринтом Эмбера я провёл с этой нейронной сетью. Сама сетка, кстати, прекрасно себя показала в генерации разных картинок. А тож! Она построена на технологии Stable Diffusion. Только более «дружественная».
Смотрим, что она изобразила.
Наконец-то! Это очень близко к тому, что сам себе представлял. Но у каждого же складывается свой образ от прочитанного.
Было бы интересно услышать, кому какой вариант понравился больше, этот или предыдущий? Не стесняйтесь, пишите в комментариях!
Продолжение: Опять Роджер Желязны и нейросети Stable Diffusion и Recraft
PS.
На заставке статьи изображен мифический Единорог, тоже персонаж Хроник Эмбера, и также от Leonardo AI.
Если кликнуть по названию канала, то увидите другие статьи. Можно выбрать еще что-то интересное для себя. А для просмотра будущих статей и поддержки автора — лучше вообще подписаться.
Имеется также постоянно обновляемый гид-путеводитель по статьям канала.
#нейросеть #нейронныесети #ИИ #AI #neuralnetworks #искусственныйинтеллект #генерацияизображений #stablediffusion #midjourney #chatgpt #leonardo #роджержелязны #хроникиэмбера #лабиринтэмбера #bluewillow #Recraft