Найти тему

Нейросети: создание иллюстраций

Оглавление

В этой статье расскажу вам о Нейросетях и сервисах, которыми самостоятельно пользуюсь для создания иллюстраций к своим работам.

Важный дисклеймер: в данный момент большинство нейросетей работают на английском языке, так что полезно будет также и обзавестись хорошим переводчиком.

Что важно знать перед первым использованием

Основа генерации изображений – промпты (prompt) – это текстовое описание картинки. Многие нейросети уже могут воспринимать художественное описание, но точнее и удобнее будет использовать тэги – ключевые слова перечисленные через запятую. Пример промпта:

fantasy dungeons & dragons portrait by Terese Nielsen, female elf, green hair, pointy ears, ponytail, light leather armor, beautiful, detailed, elaborate

Для некоторых нейросетей важно писать промпты в определенном порядке. Потому что, особенно бесплатные версии, могут не воспринять слишком длинные тексты и чем дальше будут слова, тем хуже он их отобразит.

Важно понять и что такое негативные промпты (negative prompt). Когда нейросеть предоставляет вам возможность воспользоваться ими, не ленитесь и облегчите работу программе и себе. Это промпт того, чего не должно быть на изображении. Часто это технические характеристики и негативные аспекты картинки. Например, негативный промпт для людей:

Ill, paledeformed, extra limbs, extra fingers, mutated hands, bad anatomy, bad proportions, blind, bad eyes, ugly eyes, dead eyes, poorly drawn hands, poorly drawn face, mutation.

Как можно увидеть, часть характеристик относится к искаженным частям тела, искаженным глазам, пальцам и так далее. Чаще всего негативный промпт даже больше основного.

Помощь с написанием промптов

К счастью, не все так страшно, как может показаться. Ведь есть и сервисы для генерации промптов.

MidJourney Prompt Helper

В первую очередь сервис ориентирован на нейросеть MidJourney, которую разберем ниже. Сейчас нас интересует возможность, которую он предоставляет, а именно превью некоторых не особо понятных на слух параметров. Например, стиль определенных артистов, линза фотообъектива, освещение и материалы.

Clip Interragator

Отличный сервис, если у вас есть подходящий референс для предстоящей работы. Принцип работы максимально простой – вставляете файл, выбираете качество оценки фотографии, ждете и получаете желаемый результат.

Пример разбора картинки
Пример разбора картинки

Lexica.art

Главный смысл этого ресурса – галерея вдохновения. Сайт предоставляет огромную подборку работ пользователей с открытыми промптами и настройками. Увидели что-то цепляющее глаз – зашли и скопировали.

Побочная функция ресурса – встроенный быстроработающий генератор изображений. Удобно для тестирования созданных промптов, так как выполняет запросы почти без очереди и с обширным количеством настроек. Приятным бонусом ко всему этому идет возможность использование вашего изображения для направления работы нейросети.

Уже этого уровня в принципе достаточно для использования созданных изображений в качестве иллюстраций, но это зависит от ваших требований. Большим минусом этого генератора является довольно неадаптивная модель, которую он использует для создания картинок. Так что тестируйте, но не забывайте и про другие доступные варианты.

Русскоязычные нейросети от Яндекс и Сбербанк

Не так давно наткнулся на Шедеврум в рекламе и после того, как удостоверился, что проект действительно от Яндекса решил проверить лично. Результатом остался приятно удивлен, а во время написания статьи обнаружил для себя и такую вещь, как Kadinsky от Сбербанк.

Плюсы/Минусы

  • Русскоязычный интерфейс. Всегда удобнее работать на родном языке.
  • Свежая адаптивная модель. Изображения адаптируются под запрос и выглядят по-разному, хотя иногда ради эффекта придется постараться. Приятный бонус – модель отличается от генерации других нейросетей, так что спутать ее изображения сложно.
  • Разрешение изображения. Спорный пункт для Шедеврума, так как в данный момент нейросеть предоставляет изображения в формате 256х256. Kadinsky в свою очередь генерирует картинки вплоть до 764х764.
  • Скорость генерации. Редко когда придется ждать больше минуты.
  • Функционально. (Касается только Kadinsky) В веб-версии можно генерировать изображения и дорисовывать пользовательский файл. В боте в Телеграм доступны также смешивание двух разных изображений и смешивание текста и изображения.
  • Бесплатно. Казалось бы, не особо важный факт, но приятное дополнение.

Как воспользоваться?

Шедеврум работает на базе отдельного приложения, которое можно найти в Google Play или AppStore.

Воспользоваться Kadinsky можно несколькими способами:

Виновники торжества

И начнем со слона в посудной лавке, о котором уже все знают и наслышаны. Представляем вашему вниманию великий и ужасный MidJourney.

MidJourney

Одна из самых популярных нейросетей с огромным количеством пользователей. Не так давно вышло обновление до пятой версии и ее прогресс не перестает удивлять.

Сравнение генерации изображения одинакового промпта первой версии и пятой
Сравнение генерации изображения одинакового промпта первой версии и пятой

Из-за большого опыта, накопленного пользователями, нейросеть делает очень реалистичные изображения и способна переключаться от одного стиля к другому. Именно здесь вам пригодится описанный выше MidJourney Prompt Helper, чтобы оценить все доступные возможности.

Плюсы/Минусы

  • Англоязычный интерфейс. Немного усложняет использование, но в эру онлайн-переводчиков не составляет проблему.
  • Огромное количество пользователей. Генерация обучена миллионами запросов и может подстроиться под любое требование.
  • Бесплатно. Но с оговорками. Бесплатно генерировать можно только используя общий чат и ограниченное количество изображений. В периоды особой нагрузки генерирование без подписки может быть невозможным.
  • Скорость генерации. Если использовать бесплатную версию, то изображение будет готов в течение нескольких минут.
  • Разрешение. Позволяет генерировать изображения в формате до 1024х1024. Но генерация изображений высокого качества тратит больше доступных действий бесплатного периода.

Как пользоваться?

  • Для использования MidJourney потребуется аккаунт в Discord.
  • После регистрации перейдите по ссылке и подключитесь к серверу MidJourney.
  • Выберите любой чат слева с названием newbies-#
  • Либо скопируйте необходимый промпт из сервиса MidJourney Prompt Helper, либо введите команду /imagine promt:#ваш текст#

Также можно контактировать с ботом MidJourney в Discord напрямую, но доступна эта функция только подписчикам сервиса. Ниже вы можете ознакомиться со стоимостью ежемесячных и годовых подписок.

-8

StableDiffusion

Персональный любимчик. Практически все иллюстрации я делаю через него и опыта работы со StableDiffusion у меня больше всего.

С официального сайта можно воспользоваться двумя главными функциями: онлайн-генератор изображений и поиск работ других пользователей по ключевым словам. Немного о последнем.

В отдельном разделе сайта в поисковой строке вводим любое слово на английском и получаем пользовательскую галерею с введенными при создании промптами. Находим то, что нам подходит и копируем текст, слова или промпт целиком.

-9

Теперь можно переходить к генерации изображений и разобрать все по пунктам.

Пример генерации изображения через StableDiffusion
Пример генерации изображения через StableDiffusion

Плюсы/Минусы

  • Англоязычный интерфейс. Кто-то может оставить идею пользования StabbleDiffusion уже на этом моменте, но советую переселить себя и протестировать на своем опыте.
  • Одна из самых опытных адаптивных моделей. Может подстроиться практически под любой запрос и под все критерии. Считывает большое количество промпта.
  • Разрешение. Позволяет генерировать до 4ех изображений одновременно в формате 512х512.
  • Скорость генерации. В среднем ожидание занимает около минуты, но в пиковое время онлайна (не по времени РФ) может занимать и больше времени.
  • Простота интерфейса. И плюс и минус, легко разобраться, но в онлайн версии отсутствует редактирование изображений и использование изображения в качестве референса. Также, в периоды повышенной активности отключается возможность ввода негативного промпта.
  • Бесплатно. Неожиданно, учитывая количество функционала и его качества.

Как пользоваться?

Есть два способа: простой и над которым нужно потрудиться, но результат вам понравится больше.

ПервыйStabble Diffusion Online на официальном сайте проекта. На него действуют ограничения 14+ и необходимо ждать свою очередь для генерации.

Второй – установить Stabble Diffusion локально себе на компьютер, что открывает огромное количество возможностей: редактирование изображений через генератор, жестокий контент (кровь и тп.), использование различных моделей, в том числе и натренированных вами.

Но, чтобы осуществить второй способ, придется немного потрудиться. После выпуска этой публикации начну работу над статьей касательно данной темы. Я сам постепенно переезжаю на этот способ генерации.

Приятный постфактум

В завершении хотелось бы рассказать также и о нескольких сервисах, которые помогут вам улучшить полученные работы. Можно воспользоваться Photoshop и подправить неровности нейросети, но сейчас не об этом.

Вы могли заметить, что большинство продемонстрированных генераторов работают в довольно малом разрешении. Для исправления этого можно воспользоваться любым онлайн-сервисом по запросу Upscale AI. Я же при работе с телефоном использую Img.Upscaler. Выполняет задачу быстро и качественно.

Для тех же, кто планирует работать преимущественно за ПК и ищет вариант НЕбраузерного сервиса, может подойти Upscayl – опенсорс программа, работающая на Linux, Windows и MacOS.

На сегодня это все! Спасибо за прочтение, буду рад обсудить эту тему с вами в комментариях и ответить на любые вопросы. Все высказанное здесь является личным мнением человека, который сам только погружается в данную тематику.