Найти тему
РБК Тренды

Зачем нужны технологии искусственного интеллекта и нейросети в дизайне

Оглавление

Могут ли нейросети заменить людей и стоит ли дизайнерам переживать о будущем профессии, рассказывает Артем Говердовский, директор по дизайну GeekBrains

   Изображение сгенерировано нейросетью Midjourney по запросу «Дизайнер использует искусственный интеллект»
Изображение сгенерировано нейросетью Midjourney по запросу «Дизайнер использует искусственный интеллект»

В работе дизайнера функционал нейросетей используется давно, а бурный рост этого направления начался примерно полтора года назад и до сих пор набирает обороты. Например, в августе 2022 года в штате Колорадо на конкурсе изобразительного искусства победила картина, созданная математической моделью. Это — первый случай, когда в открытом конкурсе искусственный интеллект обошел художников.

Как ИИ создает дизайн и помогает в работе

Программы искусственного интеллекта работают проще, чем многие представляют. Они создают визуальные образы из запроса, короткой фразы или предложения, которые пишет человек. Их используют художники, авторы текстов, видеографы, музыканты. Но если говорить, как ИИ помогает именно дизайнерам, можно выделить следующие нейросети и функции, которые они выполняют:

  • DALL-E-2 — недоступна для российских пользователей, но они могут использовать DALL-E Mini.
  • ruDALL-E — аналог DALLE-E от отечественных разработчиков, дает возможность делать запросы на русском языке. В этом же помогают программы Dream by WOMBO и Starryai.
  • Stable Diffusion — генерирует изображения по текстовому описанию. Можно установить на компьютер и работать оффлайн.
  • Midjourney — одна из самых популярных Discord нейросетей, которая генерирует изображение по текстовому описанию.
  • GauGAN — создает изображения даже из плохих неразборчивых рисунков.
  • Sketch Metademolab — оживляет детские рисунки.
  • Ostagram — объединяет две картинки в одно целое.
  • Gigapixel AI — увеличивает разрешение цифровых изображений и улучшает качество.
  • MyHeritage — «оживляет» изображения.
  • Removebg — позволяет за несколько секунд удалить фон с фотографии.
  • Clipdrop.co — убирает фон, вырезает объекты, улучшает качество, добавляет источник света.
  • Colorize — программа на основе ИИ, которая раскрашивает черно-белые изображения и видео.
  • Deeppaintbot — бесплатный бот в Telegram для улучшения качества фото.
  • Neural.love — нейросеть повышает качество фото, аудио и видео. Также генерирует картинки по текстовому запросу.
  • Convert.leiapix — создает из изображений простые анимации, которые можно выгрузить в формате MP4 и GIF.

Смысл нейросети в том, что она обучается, но делает это не сама, а при помощи человека. Она заполняется доступными медиа базами и выдает результат, ссылаясь на источник и его параметры (подписи). Например, нейросеть обрабатывает фотографии из базы, где написано «девушка» и запоминает, как выглядит девушка. Чем больше база — тем точнее результаты.

В базе данных могут быть картинки с подписью «офисный работник работает на ноутбуке». По этому примеру нейросеть запоминает, как именно нужно сидеть за ноутбуком и что из себя представляет такая работа. Если вбить запрос «девушка работает на ноутбуке» ИИ объединит свои знания об этих объектах и создаст собственную картинку.

Для нейросети — найти что-то похожее по текстовому совпадению и создать что-то новое — разные задачи. Например, если написать «Молодая девушка работает на ноутбуке на балконе с видом на острова в океане на закате», нейросеть начнет разбирать текст на составляющие: «молодая девушка», «работает на ноутбуке», «на балконе». По каждому слову найдет совпадение и только после начнет совмещать картинки и генерировать изображения. Чем более детально сформулирован запрос, тем точнее результат.

Нейросети работают по-разному: одни делают акцент на соответствие рисунка запросу и присылают одно изображение. Другие создают сразу несколько вариантов, из которых можно выбрать подходящий. Какие-то рисуют быстро, но менее точно, другие — долго, но детально.

Технология быстро меняется, с каждым разом ее алгоритмы лучше. Раньше можно было запросить «красный кубик», а получить красный круг — нейросеть неправильно понимала запрос. Сейчас же она нарисует разные вариации красного кубика. Поэтому в дизайне ее стали использовать как прикладной инструмент для генерирования идеи. Также нейросети умеют достраивать картинки. Можно взять фотографию и попросить программу достроить изображение в этом же стиле, но по ее усмотрению.

Основная задача для корректной работы нейросети лежит на разработчиках. ИИ должен обращаться к источнику, где картинки правильно подписаны. Как вариант, программа может искать изображения в «Яндексе» и Google — это простой, но не всегда действенный способ. Многие изображения загружаются в сеть без названий, либо картинки подписаны некорректно: например, 12345678бкв.

Когда разработчики создают нейросеть, они обычно генерируют свою базу и сами подписывают картинки. Это помогает нейросети правильно воспринимать информацию и подбирать релевантные изображения.

Примеры дизайна, созданного ИИ и нейронными сетями

Многие нейросети позволяют задать следующие параметры:

  • Вес. Используется для регулирования соотношения элементов на изображении.
  • Качество. Чем лучше качество изображения, тем больше получается деталей и картинка выглядит красивее.
  • Соотношение сторон.
  • Рендеры, камеры, стили и прочее.
  • Дорисовка конкретного изображение или обучение на основе конкретного объекта.

Рассмотрим пример текстовых запросов.

Ограничение текущих моделей ИИ

Не все нейросети справляются со своей работой. Иногда в результате может получиться что-то одновременно пугающее и завораживающее, но не подходящее под запрос. Некоторые генерируют настолько необычные картинки, что не понятно, человек это нарисовал или нет.

Нужно еще раз отметить, что для нейросети важно четко и детально прописывать запрос. Можно вбить текст «молодая девушка», а в результате получится безвкусная картинка. Или попробовать прописать запрос детально: «молодая девушка на пляже, стиль барокко». В таком случае ИИ создаст креативную иллюстрацию.

Также ведутся споры о юридической стороне нейросетей. До сих пор непонятно, можно ли использовать работы ИИ без указания авторства, считать ли сеть владельцем работы или разработчика. Некоторые авторы добавляют водяной знак на картинки, другие — дают платный доступ к нейросети. Это закрывает часть юридических вопросов, но они все равно остаются.

Еще одна проблема — процесс обучения. Нейросети могут выдавать некорректные результаты по запросам, если обучались на базе данных с ошибками. Например, когда фотографии молодой девушки подписана как «пожилая женщина» или камаз подписан как «машина», а дизайнер ищет легковой автомобиль. Это вводит нейросеть в заблуждение, она путается и создает нерелевантные визуальные образы.

Даже когда запрос прописан максимально детально, нейросеть может выдавать ошибочный результат, потому что сама себя генерирует. Если нужна картинка скоростной машины, она может нарисовать ее в реалистичном, мультяшном стиле или карандашом. Поэтому еще одна сложность — направить нейросеть, чтобы она рисовала корректные картинки в фирменном стиле и не пыталась навязать свой.

До сих пор существует проблема с отрисовкой реальных человеческих лиц. ИИ может совмещать сразу несколько изображений, эффекты освещения и тени будут немного неправильными, или слиты границы двух объектов, которые должны различаться. Самые большие проблемы у нейросетей обычно вызывают глаза — на сгенерированных изображениях они получаются смазанными, без зрачков или наоборот с одним зрачком без радужки.

Искусственный интеллект против дизайнеров: за кем будущее

Сейчас нейросети не заменят дизайнеров, но их можно рассматривать в качестве помощников. ИИ помогает преодолеть страх «белого листа», когда дизайнер не знает, с чего начать. При этом, некоторые художники воспринимают нейросеть как потенциального конкурента. Например, графические дизайнеры переживают больше, чем специалисты UX- и UI-направления. С точки зрения графического дизайна, нейросеть выдает ровно тот результат, который запросил человек. Например, можно попросить ИИ нарисовать иллюстрацию ребенка, который держит букет цветов, в стиле Мане. Это займет пять минут. Если бы это делал графический дизайнер, у него бы это заняло от несколько часов до целого дня.

Несмотря на эти достижения, нейросетям не хватает профессиональных черт, чтобы соперничать с дизайнерами интерфейсов. Человеку необходимы эмпатия и логическое мышление, чтобы создавать удобные и функциональные сайты, иллюстрации под тематику и контекст, айдентику, которая передает ценности бренда. Нейросеть не ориентируется на удобство для пользователя, она пытается подобрать максимально релевантный образ под запрос. Она нарисует мобильное приложение для банка, но не сможет провести исследование, собрать фокус-группу, отследить конверсию, определить, что работает, а что — нет.

Люди могут общаться между собой, обсуждать, как довести визуал до идеала, чего не хватает изображению. Нейросеть лишена такой возможности, с ней нельзя вступить в диалог. ИИ не может проигнорировать команду, спорить с дизайнером, аргументировать, почему она так нарисовала, строить результат в зависимости от контекста.

Важно отметить, что результаты генерации нейросетей нужно править и контролировать. Почти невозможно с первого раза получить идеальный финальный результат. Если программа не может создать адекватное изображение, его должен доработать дизайнер. В целом, нейросети могут решать следующие проблемы:

  • подбирать референсы и искать новые идеи для вдохновения;
  • создавать визуальные концепты и наброски с безграничной фантазией;
  • быстро работать и экономить время дизайнера, избавлять его от рутинных задач.

Уже появляются профессии на стыке дизайна и DataScience. В сети можно встретить запросы и даже курсы по данным направлениям:

  • оператор нейросетей,
  • нейроартист,
  • prompt-дизайнер,
  • координатор нейросети,
  • генеративный дизайнер.

Если дать краткое описание таким профессиям — это специалисты, которые умеют общаться с ИИ на понятном для него языке, чтобы получать предсказуемые результаты, и знает, когда и какую программу использовать. Один специалист хорошо работает с лицами, другой может увеличивать разрешение картинки в разы без потери качества, третий — из скетча генерирует полноценную картинку.

Внутри компании нужно организовывать направление по развертыванию на своей инфраструктуре opensource-нейронных сетей, а потом обучать ее нужному стилю. На это нужны отдельные специалисты. По данным Всемирного Экономического Форума, к 2025 году искусственный интеллект может заменить специалистов в области изобразительного искусства, кинематографа, журналистики, программирования и других сфер. Случится это или нет, будет понятно в ближайшие два года. Либо нейросети будут развиваться и станут полноценным инструментарием дизайнера вплоть до полной его замены, выполняя работу быстро и качественно, либо останутся на текущем высоком уровне, который лишь помогает сохранить время специалиста.

В штате Колорадо мужчина выиграл в конкурсе изобразительных искусств благодаря картине, созданной в нейросети Midjourney. Случай завирусился и начались споры, правильно ли, что на выставке участвовал визуал, сгенерированный нейросетью. Многие раскритиковали работу за необычный метод создания, но сам автор считает, что победил честно, так как текстовое описание задавал именно он. Мужчина несколько недель создавал запросы, чтобы получить желаемый результат. К тому же получившуюся работу создатель редактировал в различных программах. В целом, это концептуальный вопрос, но рассуждения ведутся до сих пор. Все-таки, это не мог сделать неопытный человек: чтобы создать такую работу, недостаточно вбить запрос, нужно потратить много времени, изучить математическую часть, прокачать навыки в работе с нейросетью.

Чтобы избежать разногласий, на Behance, как и на других сайтах, будут появляться отдельные разделы с пометкой «сгенерировано нейросетью». Люди смогут понимали, что полностью создано дизайнером, а какие работы — нейросетью.

Как дизайнерам адаптироваться к новой реальности

Любому человеку в своей сфере работы нужно следить за тем, что происходит в мире, изучать и оценивать тренды. Уметь работать с нейросетью — важный навык для дизайнера, особенно, пока это не все умеют делать. Это позволяет креаторам прокачивать свои скиллы, экономить время и не выгорать.

Нейросеть способна влиять на человеческую креативность, помогать по-другому смотреть на создание иллюстраций. Далеко не все специалисты могут выдавать результат, который удается создать нейросети. Каждый раз получается что-то новое и уникальное. За несколько минут она может придумать четыре варианта изображений, человек на это тратит от нескольких часов до целого дня.

Популярные нейросети, которые используются в дизайне

Популярной нейросетью считается Stable Diffusion — самая прокачанная, но в то же время, сложная в использовании программа. Ее нужно устанавливать на ПК, пользоваться онлайн в браузере не получится. Эта нейросеть выдает релевантный и практичный результат, более-менее попадает в запрос пользователя.

Вторая по значимости — DALL-E, у которой есть много версий, одна из самых популярных — DALL-E-2. Сейчас она недоступна для российских пользователей, но они могут использовать DALL-E Mini. Также можно работать с Midjourney, которая не требует специфических знаний для работы.

Чтобы выбрать «свою» нейросеть, нужно понять, для каких целей она нужна. Для рядового пользователя нет разницы, в какой программе работать. Они действуют по одному принципу: человек вбивает запрос — ИИ выводит результат. Различия начинаются после того, как пользователь получает итоговую работу. Например, в DALL-E-2 можно доработать каждый блок результата, а Midjourney пока не позволяет этого сделать.