Найти в Дзене

Роджер Желязны о нейронных сетях

Оглавление
Мифический белый единорог. Нейронная сеть Leonardo AI
Мифический белый единорог. Нейронная сеть Leonardo AI

Ой, sorry, sorry! Это не Роджер о нейронках, а нейронные сети о нём. Вернее, о его, наверное, самом известном произведении «Хроники Эмбера».

С большой натяжкой сюжет книги с чисто человеческой, понятной точки зрения, похож на интригу сериала «Игры престолов». Но Хроники гораздо глубже, с магией и перемещениями в пространстве-времени, на фоне глобальной темы добра и зла. И написаны они были за много лет до фильма.

Скорее, «Игры престолов» создавались «по мотивам» Хроник.

Однако, начнём с начала.

Начало

Давным давно, после распада Союза, в эпоху жесточайшего голода по приличной и интересной литературе и огромнейших очередях в книжные магазины, как грибы стали появляться самопальные переводы известных зарубежных произведений. Мне посчастливилось купить «Хроники Эмбера» Роджера Желязны, половину его десятикнижия, посвященной Корвину. И несмотря на просто безобразнейшее качество и перевода, и самого типографского издания, эта вещь меня зацепила.

Мне довелось устроиться на работу в СП с американцами. Причём, моя не совсем рядовая должность давала мне право попросить коллегу, работавшего со мной в отделе, во время своего очередного R&R (отпуска на родину) купить для меня эту серию книжек.

Английский мой был тогда ещё не очень хорош, но даже он дал мне возможность оценить не только простоту, но также мощь и сочность языка Желязны в оригинале. Бедные наши читатели, радовавшиеся низкопробному переводу…

Уже прошло много лет, а я до сих пор храню эти книжицы, бережно обернутые в плотную бумагу, чтобы не пострадали обложки с великолепными иллюстрациями из эпопеи. Время от времени перечитываю.

-2

Эмбер в эпоху наступающей эры нейронных сетей

Когда я вплотную занялся нейросетями, генерирующими изображения, мне дико захотелось увидеть те, еще живущие в мозге воображаемые картинки так, как смогут их показать нейронки.

Начал я, конечно, с самого простого. С Арденского леса.

Напомню, что есть целый ряд нейросетей, генерирующих изображения. Самые известные из них - Midjourny, Stable Difusion и DALL-E. На вход им нужно подать текстовое описание (промпт) того, что хотим получить. При этом, предпочтительнее это делать на английском, потому как это язык создателей нейронок. Некоторые сети принимают и русский. Но, понятно, тут вмешивается качество перевода, и каким бы он качественным ни был, играет он в худшую сторону.

Поэтому промпт для картинки леса я составлял, сильно порезав куски текста английского оригинала, описывающего деревья. Чтобы правильные слова были. Дословно это звучало примерно так:

«Дремучий дикий лес с огромными могучими и величественными соснами, дубами и кленами, с листьями глубокого, насыщенного зеленого, слегка тронутого золотом, цвета».

Вот, что выдала нейросетка Stable Diffusion.

Арденский лес. Нейронная сеть Stable Diffusion
Арденский лес. Нейронная сеть Stable Diffusion

Здесь есть очень много от того, что указывалось в промпте. Но нет дикости, дремучести и таёжности. Попытки добавить эти свойства привели к такому результату:

Городской парк? Нейронная сеть Stable Diffusion
Городской парк? Нейронная сеть Stable Diffusion

Это стало больше похоже на дорожку в каком-нибудь городском парке. Но дальше улучшать не стал. Мне было интереснее другое.

Корвин самурай

Описание внешности Корвина пришлось бы долго искать. И мне больше поначалу ничего не пришло в голову, кроме как изобразить его самураем.

Для получения картинки выбрал самую разрекламированную нейросеть Midjourney.

Результат не порадовал. Нейросеть всё не хотела давать Корвину-самураю меч, его японскую катану. Вот максимально чего удалось достичь.

Самурай с мечом. Нейронная сеть Midjourny
Самурай с мечом. Нейронная сеть Midjourny

Сетка всё больше изображала Корвина этаким мыслителем.

Самурай-мыслитель. Нейронная сеть Midjourny
Самурай-мыслитель. Нейронная сеть Midjourny

Потом я узнал, что Midjourney плохо транслирует текстовое описание в картинку. Из-за этого от неё трудно добиться такой детализации, какую заказываешь в промпте. Зато недостаток понимания нейронка с лихвой возмещает своей достаточно однообразной фантазией.

Корвин, Лорд Эмбера

Зато другая, менее известная, но гениально простая, нейросеть Recraft почти сразу же выдала картинку, очень похожую на искомую.

Лорды Эмбера. Нейронная сеть Recraft
Лорды Эмбера. Нейронная сеть Recraft

Здесь я заказывал лордов Корвина и его визави Эрика, а также королей Ганелона и Рэндома.

Но больше всего хотелось показать Корвина и Лабиринт.

Корвин, проходящий Лабиринт

Решил применить нейросеть Stable Diffusion, одну из тех, что лучше всего понимает промпт. Не найдя на английском описания одежды лордов-эмберитов, заказал Корвину одеяние ковбоя.

Корвин? . Нейронная сеть Stable Diffusion
Корвин? . Нейронная сеть Stable Diffusion

Вот в нём он как раз и проходит. Только не Лабиринт, а по какой-то дорожке. А по краям свисают ленты разноцветной материи, видимо, означающие полосы спиралей Лабиринта.

Ладно, думаю, дело в качестве промпта. Поэтому сделаем проще возьмём пока только Лабиринт, без Корвина.

Лабиринт Эмбера с Stable Diffusion

В результате получилась какая-то спираль!

Лабиринт Эмбера. Подход 1.  Нейронная сеть Stable Diffusion
Лабиринт Эмбера. Подход 1. Нейронная сеть Stable Diffusion

Понял, что не указал угол, под которым нужно смотреть. Модифицировал промпт, намного подробнее расписав, как нейронка должна была построить спиральный лабиринт и как его показывать.

Результат был абсолютно не ожидаемым:

Скорее, широкая труба, чем Лабиринт. Нейронная сеть Stable Diffusion
Скорее, широкая труба, чем Лабиринт. Нейронная сеть Stable Diffusion

С досады я забросил на время дальнейшие попытки. Решил взять другую нейросеть.

И только сейчас, при написании статьи и повторном анализе промпта, я увидел, что Stable Diffusion — умничка! Она всё нарисовала как диктовал промпт! Вот только описание получилось двусмысленным. И нейронка изобразила тот смысл, который увидела сама.

Лабиринт Эмбера с BlueWillow

Выбрал нейросеть BlueWillow, заставил её пройти тест на рисование спирального лабиринта. Вот что получилось.

Лабиринт Эмбера. Подход 3.  Нейронная сеть BlueWillow
Лабиринт Эмбера. Подход 3. Нейронная сеть BlueWillow

Поначалу я разочаровался. Не увидел спирали. Однако, посмотрев внимательнее на промпт, понял, что спираль в нём не указана. Как и угол, под которым следовало смотреть. Но переделать не успел.

А сейчас, глядя на картинку, мне кажется, что результат очень даже неплох. Если только не требовать, чтобы лабиринт был спиральным.

Получилась наглядная иллюстрация того, как много зависит от правильного составления описания. И ещё долго только-только нарождающаяся профессия промпт-инженера (как я упоминал здесь) будет востребована. Несмотря на появившиеся системы автоматической генерации промптов.

Лабиринт Эмбера с Leonardo AI

Последний свой эксперимент с Лабиринтом Эмбера я провёл с этой нейронной сетью. Сама сетка, кстати, прекрасно себя показала в генерации разных картинок. А тож! Она построена на технологии Stable Diffusion. Только более «дружественная».

Смотрим, что она изобразила.

Лабиринт Эмбера. Подход 4.  Нейронная сеть Leonardo AI
Лабиринт Эмбера. Подход 4. Нейронная сеть Leonardo AI

Наконец-то! Это очень близко к тому, что сам себе представлял. Но у каждого же складывается свой образ от прочитанного.

Было бы интересно услышать, кому какой вариант понравился больше, этот или предыдущий? Не стесняйтесь, пишите в комментариях!

Продолжение: Опять Роджер Желязны и нейросети Stable Diffusion и Recraft

PS.

На заставке статьи изображен мифический Единорог, тоже персонаж Хроник Эмбера, и также от Leonardo AI.

Если кликнуть по названию канала, то увидите другие статьи. Можно выбрать еще что-то интересное для себя. А для просмотра будущих статей и поддержки автора — лучше вообще подписаться.

Имеется также постоянно обновляемый гид-путеводитель по статьям канала.

#нейросеть #нейронныесети #ИИ #AI #neuralnetworks #искусственныйинтеллект #генерацияизображений #stablediffusion #midjourney #chatgpt #leonardo #роджержелязны #хроникиэмбера #лабиринтэмбера #bluewillow #Recraft