Найти тему
Веб-студия Итерация

Почему нейросети тяготеют к мрачной эстетике? Могут ли они заглядывать в прошлое или будущее? Почему они не умеют рисовать руки?

Один из интересных моментов, связанных с нейросетями, заключается в том, что в определенном смысле нейросеть может «проявлять» образы из коллективного бессознательного, или по крайней мере — генерировать именно такие картинки, какие ожидало/хотело бы увидеть по каждому запросу БОЛЬШИНСТВО пользователей.

Работает это так: под каждый запрос нейросеть стремится предложить такое решение (обычно — несколько на выбор), которое согласно ее внутренней статистике взаимодействия с пользователями является наиболее релевантным. Например, по запросу «города Атлантиды» сеть скорее всего создаст картинки водных или затонувших городов, а не оазисов в пустыне, потому что именно так люди рисуют в своем воображении Атлантиду.

В этом контексте интересно поиграть с сетью, задавая ей различные запросы на грани провокационных, касающиеся прошлого или будущего: «как на самом деле были построены пирамиды», «первый контакт с внеземной цивилизацией», «вечный двигатель», «пятый элемент» и проч. Бытует мнение, что в результате такого общения с «искусственным интеллектом» можно получить довольно нестандартные и в то же время правдивые ответы на некоторые вопросы.

Как были построены пирамиды
Как были построены пирамиды

Однако, следует иметь в виду и то, что точные алгоритмы создания изображений известны только разработчикам и обычные пользователи не могут знать наверняка были ли в систему изначально заложены какие-то установки или сеть просто следует вкусам и ожиданиям пользователей.

Так, например, совершенно очевидно, что нейросети тяготеют к мрачной эстетике, использованию черного, темно-серого и других темных тонов, а также к стилистике стимпанка и киберпанка. То есть если вы специально НЕ уточните в своем запросе, что необходимо «доброе», «милое», «светлое» изображение и/или картина в ярких или светлых тонах — то, скорее всего по умолчанию получите именно нечто в настроении «Игры престолов».

Почему так происходит сказать трудно, возможные варианты следующие:

  • так задумано разработчиками;
  • первыми в нейросети пришли геймеры, анимэ-художники и прочий подобный контингент пользователей, запрашивающий именно такие изображения — соответственно, именно по данному направлению самообучение нейросетей идет быстрее всего.
  • современное общество (или точнее та его часть, которая так или иначе пользуется нейросетями) тяготеет к такой стилистике, что является неким отражением вкусов нашего времени.
Портрет - девушка в шлеме ворона
Портрет - девушка в шлеме ворона

Почему нейросеть НЕ умеет рисовать руки и пальцы?

Нейросети практически с самого своего выхода в открытый доступ отлично справлялись с общей композицией, созданием определенной атмосферы и текстурами. При этом в плане деталей они довольно часто проседали: нередко силуэты людей, техники или зданий нарисованы как бы мазками, без соблюдения углов и пропорций. На некоторых изображениях отчетливо видно, что они буквально составлены из каких-то отдельных лоскутов, которые сшиты не слишком умело.

Так, ряд окон может оказаться ниже фундамента, здания могут быть увенчаны какими-то невообразимыми конструкциями, словно алгоритм не до конца определился нужны ли провода, антенна или шпиль, а человек может стоять в совершенно неестественной позе, так что зрителю непонятно развернут ли он лицом, спиной или боком.

Безусловная красота проявленная во влюбленных
Безусловная красота проявленная во влюбленных

Наибольшие проблемы нейросети испытывали с изображением глаз и кистей рук. Наверное, потому что первые — «зеркало души», а вторые — один из самых сложных и «ювелирно» настроенных органов человека, позволяющий нам осуществлять с одной стороны тысячи тончайших манипуляций, а с другой — и целый ряд силовых приемов. Размеры фаланг каждого пальца соотносятся друг с другом в пропорции «золотого сечения» 1,618. В одной кисти 27 костей, сочлененных суставами и связками и 34 мышцы — соответственно, мы имеем миллионы вариантов того как могут быть сложены или распрямлены человеческие пальцы и способностей нейросети пока (!) не хватает, чтобы с помощью своего «лоскутного» механизма составления изображений приблизиться к подобной сложности. При этом любые огрехи в данном случае особенно режут глаз.

Справедливости ради нужно сказать, что за последние полгода нейросети уже значительно усовершенствовали свои алгоритмы и/или обучились. Теперь (зима 2023) и глаза и руки удаются им на порядок лучше, чем летом 2022 года, когда легко можно было увидеть и шестипалые кисти и вовсе какие-то нечеловеческие клешни. Однако, до идеала настоящей человеческой руки или глаз, а уж тем более определенного выражения глаз — нейросетям еще очень далеко. И здесь опять же художники и дизайнеры вне конкуренции.

Больше интересных материалов на тему нейросетей и веб-дизайна у нас в блоге.

************************************

Оставляйте заявки на разработку и продвижение сайтов здесь:

Официальный сайт веб-студии

Следите за нашими новыми статьями, обзорами и полезными материалами по веб-дизайну, seo, нейросетям и интернет-маркетингу в соц.сетях:

Канал веб-студии ИТЕРАЦИЯ в VK

Канал веб-студии ИТЕРАЦИЯ в Дзене