Найти тему

Как создать внешность литературного персонажа?

Оглавление
"Черпай вдохновение в себе" - примерно с таким подходом я дожила до своих N лет, не закончила толком ни одной книги и не стала писателем.

Отчего-то хуже всего вдохновение черпается, когда дело доходит до внешности персонажей, о которых я вроде как должна писать, как о живых людях. Но достоверно представить на бумаге героя, имея представление о его внешности на уровне цвет глаз, цвет волос и рост, - задача непосильная.

Моя беда в том, что, вероятно, я неправильный автор. Мне тяжело в мелочах представлять внешность своих героев. Обычно я твердо уверена в каких-то отдельных чертах, могу представить комплекцию и с натугой придумать какую-то характерную деталь, например, хромоту на одну ногу. Но вообразить каждую черточку... нет.

Раньше я часами шерстила интернет в поисках фотографий незнакомых людей, 3D портретов и аниме зарисовок. Эти изображения служили референсами, помогали подстегнуть воображение и сделать моих героев более живыми и осязаемыми - хотя бы для меня самой.

Кстати, практически все книги по писательскому мастерству призывают к читерству. Разглядывай людей, подслушивай людей - примерно так вкратце звучат эти советы, лишенные налета вежливости и уважения к личным границам.

Но сейчас я несказанно рада, что в нашу повседневную жизнь ворвались нейросети. Мне не надо добиваться от них идеального сходства с воображаемым образом, совсем наоборот - как раз от нейросети я ожидаю четкий портрет по моим смутным описаниям, к которому впоследствии смогу обращаться.

Тем не менее, я решила не пренебрегать рекомендацией и понаблюдать за людьми вокруг. Оказывается,если оторвать взгляд от экрана телефона и нескончаемой ленты безрадостных новостей, то можно обнаружить себя посреди удивительной картотеки будущих героев.

Я устроила себе небольшой челлендж: в течение 5 дней находить в толпе одно лицо, которое зацепило меня больше остальных, и создавать его словесный портрет.

Пожалуй повторюсь: не встретить в метро k-pop идола или Анджелину Джоли, а найти лицо, на которое захотелось посмотреть второй раз. Причём, необязательно привлекательное - не могут все герои книги выглядеть так, словно с книжных страниц шагнут сразу на подиум. А участь некоторых персонажей вовсе сводится к тому, чтобы вызывать отторжение.

В итоге у меня начала собираться "галерея персонажей", которой я смогу воспользоваться в будущем. Как минимум, для создания второстепенных героев.

И коли уж я люблю все классифицировать и писать инструкции, то дальше текст от душнилы, которая:
- Воспринимает нейросети как чудо
- Пользуется ими для кустарного решения собственных маленьких задач и радуется любым условно удачным решениям
- Не понимает как это все работает, не зарабатывает этим и не стремится

У меня сразу сложилась система каталога для портретов. И так как пока что это просто лица "отложенные на будущее", то у них нет имён, профессий и эпохи. Их истории ещё не описаны. Поэтому каждый такой персонаж я классифицирую по полу, возрасту (в годах), возрастной группе (ребёнок, подросток, young adult, взрослый, пожилой) и цвету волос. А имена у них одинаковые: Jane Doe, John Doe, Baby Doe...

Табличный вид каталога c "быстрыми" параметрами сортировки и поиска
Табличный вид каталога c "быстрыми" параметрами сортировки и поиска

Когда для кого-то из "палетки" найдётся место в романе, я возьму его из каталога и дам уникальное имя, биографию и цель, но пока это безымянные лица, грубо прописанные сухими словами.

Мне нравится "прогонять" получившийся набор черт через разные нейросети, чтобы посмотреть насколько непохожими получаются одни и те же люди через призму разных тренировочных датасетов.

Моя неразделенная любовь, конечно, Midjourney. Разделила нас необходимость её оплачивать. Своих героев ненаписанного романа я отрисовала именно в ней, и коли уж пока нет острой необходимости в суперкачественных портретах, то пока что я скупердяйничаю и пользуюсь бесплатными возможностями

Что есть из бесплатного?

  • Бот Kandinsky в телеграмме, как правило, неважно справляется с моими запросами, но у него есть неоспоримое преимущество в плане доступности - все происходит в чате, отправить описание можно сразу и при первом результате уточнить очевидные огрехи в описании. К тому же бот взаимодействует с пользователем на русском, поэтому дополнительных "подпрыгиваний" в формулировках удаётся избегать.
  • Мой русскоговорящий бесплатный фаворит Fusion Brain, требующий простой регистрации. По сути тот же Кандинский, но более тонкой настройки. Основное преимущество взято у нейросети Stable Diffusion, а именно: негативный промпт - то есть возможность указать нейросети чего именно не должно быть на картинке без использования отвергаемых нейросетями отрицательных частиц.
  • Stable Diffusion будет требовать от вас постановки задачи на английском, но с такими помощниками как ChatGPT или GigaChat это перестаёт быть камнем преткновения. Являясь пионером, StableDiffusion выдаёт очень интересные результаты, но не терпит запросов с наскока и непродуманных промптов. Тут интересно посмотреть сразу 2 формата - бесплатно и без регистрации WebUi, с регистрацией и 10 бесплатных картинок в день. Результаты по одному и тому же запросу отличаются, и не всегда можно угадать в каком окне сгенерированная картинка окажется лучше.

Проблемы с нейросетями, на которые я милостиво закрываю глаза:

  • У меня не всегда получается побороть любовь нейросетей к бородатым мужчинам
  • Нейросети приукрашивают реальность: они делают портреты более приятными глазу, потому что их так научили - и в какой-то момент я сдаюсь и перестаю пытаться приблизиться к описываемому оригиналу
  • Не всегда можно угадать, какую часть промпта нейросеть сочтет оскорбительной. Например, Kandinsky откровенно не нравится выражение "глубоко посаженные глаза", он банит за запрещенный контент. Такая проблема и с широко посаженными глазами.

Как-то мне встретился молодой человек абсолютно славянской наружности, но при этом с максимально стереотипным африканским носом. Пришлось придумывать много альтернативных описаний носа, чтобы сохранить эту изюминку внешности в портрете, и чтобы сеть не рисовала при этом темнокожего красавца.

Ну и закончу развлекательным контентом для привлечения внимания - те самые Джейн и Джоны.

Палетка персонажей

Jane Doe Blonde 35

Возраст: 35. Пол: женский. Фенотип: нордический тип внешности. Форма лица: широкое. Цвет волос, длина, прическа: блондинка, длинные, прямые, убраны назад. Цвет глаз и форма, расположение: голубые, небольшие, расположены близко к переносице. Форма, размер носа: длинный, крупный. Форма, размер губ: крупные, бледные. Форма, размер, цвет бровей: светлые, тонкие, вразлет. Подбородок: тяжелый. Кожа - цвет, состояние: бледная, тусклая. Рост: 180. Осанка: ровная. Особенности внешности (морщины, шрамы, родинки и т.д): нос доминирует на лице. Эмоциональное состояние: сосредоточенная.

-3
Ближе всех по ощущению, которое оставила у меня встреченная незнакомка, оказался FusionBrain, хотя нейросеть не удержалась от того, чтобы слегка ей польстить.

Jane Doe Red 30

Возраст: 30 лет. Пол: женский. Форма лица: узкое, овальное. Цвет волос, длина, прическа: ярко-рыжие, крашеные волосы, волнистые, длина до плеч. Цвет глаз и форма, расположение: миндалевидные, карие, темная подводка. Форма, размер носа: нос маленький, аккуратный. Форма, размер губ: пухлые, нежно-розовые. Форма, размер, цвет бровей: темные узкие длинные брови. Подбородок: заостренный, маленький. Кожа - цвет, состояние: ровный, бледный тон, пудра. Эмоциональное состояние: надменная. Рост: 170 см. Осанка: прямая. Одежда и стиль: японский.

-4
Stable Diffusion не угадал с цветом волос, но в остальном оказался намного ближе к оригиналу

John Doe Black 22

Возраст: 22 года. Пол: мужской. Фенотип: европейская наружность. Форма лица: длинное, овальное, как будто вытянутое вперед с выступающими скулами. Цвет волос, длина, прическа: черные, короткие, разделены на боковой пробор, зачесаны назад. Цвет глаз и форма, расположение: большие, карие глаза. Форма, размер носа: крупный, треугольный. Форма, размер губ: тонкие, вытянутые.

-5
Откровенно говоря, ни один портрет не получился даже близко похожим на оригинал. Есть мегастрашный вариант от Dalle (из ChatGPT), однако, несмотря на его карикатурность, очень четко оказались переданы и общее впечатление от человека, и черты лица в целом - я считаю его бесспорным лидером.
Версия Dalle
Версия Dalle

John Doe Grey 42

Возраст: 42 года Пол: мужской. Фенотип: славянский тип лица. Форма лица: широкое, черты крупные, резкие. Цвет волос, длина, прическа: седой, залысины, волосы ниже плеч, собраны в пучок на затылке. Цвет глаз и форма, расположение: круглые, блеклые. Форма, размер носа: крупный, картошкой. Форма, размер губ: крупные, поджатые. Форма, размер, цвет бровей: редкие. Подбородок: крупный, тяжелый, гладко выбрит. Кожа - цвет, состояние: крупные поры. Особенности внешности (морщины, шрамы, родинки и т.д): глубокие морщины на лбу, резкие складки у рта. Эмоциональное состояние: раздраженный. Рост: 175. Осанка: сутулый, пивной живот

-7
С Kandinsky мне так и не удалось договориться относительно собранных в пучок волос, хотя эта важная часть образа. Веб версия (посередине) оказалась очень близка к оригиналу, а версия с регистрацией оставляет впечатление более мягкого и привлекательного мужчины.

John Doe Copper-Red 30

Возраст: 30 лет. Пол: мужской. Фенотип: славянская внешность. Форма лица: овальное. Цвет волос, длина, прическа: медно-рыжие, короткие, волнистые. Цвет глаз и форма, расположение: голубые, расположенные близко друг к другу. Форма, размер носа: маленький, острый. Форма, размер губ: тонкие. Форма, размер, цвет бровей: темные, тонкие. Подбородок: узкий, маленький, безвольный, гладко выбрит. Кожа - цвет, состояние: бледная, чистая. Эмоциональное состояние: надменный. Рост: 175. Осанка: ровная.

-8
Как я ни уговаривала, Kandinsky отказался сбривать бороду и усы и демонстрировать безвольный подбородок, да и в целом от оригинала примерно ничего (кроме цвета волос и глаз). А вот Stable Diffusion постарался на славу, но только в одном варианте мне удалось убедить нейросеть отказаться от рисования растительности на лице (которой у "исходника" не было).

Вот настолько непохожими получаются портреты у разных нейросетей, сделанные по описаниям с одними и теми же грамматическими ошибками. В результате, это не пять персонажей, а больше двадцати (считая тех, что остались за кадром).

-9

#лайфхакдляписателя #нейросетидляписателя #нейросеть #полезноедляавтора #брюсовабложит #созданиеперсонажей