В этой статье расскажу вам о Нейросетях и сервисах, которыми самостоятельно пользуюсь для создания иллюстраций к своим работам.
Важный дисклеймер: в данный момент большинство нейросетей работают на английском языке, так что полезно будет также и обзавестись хорошим переводчиком.
Что важно знать перед первым использованием
Основа генерации изображений – промпты (prompt) – это текстовое описание картинки. Многие нейросети уже могут воспринимать художественное описание, но точнее и удобнее будет использовать тэги – ключевые слова перечисленные через запятую. Пример промпта:
fantasy dungeons & dragons portrait by Terese Nielsen, female elf, green hair, pointy ears, ponytail, light leather armor, beautiful, detailed, elaborate
Для некоторых нейросетей важно писать промпты в определенном порядке. Потому что, особенно бесплатные версии, могут не воспринять слишком длинные тексты и чем дальше будут слова, тем хуже он их отобразит.
Важно понять и что такое негативные промпты (negative prompt). Когда нейросеть предоставляет вам возможность воспользоваться ими, не ленитесь и облегчите работу программе и себе. Это промпт того, чего не должно быть на изображении. Часто это технические характеристики и негативные аспекты картинки. Например, негативный промпт для людей:
Ill, paledeformed, extra limbs, extra fingers, mutated hands, bad anatomy, bad proportions, blind, bad eyes, ugly eyes, dead eyes, poorly drawn hands, poorly drawn face, mutation.
Как можно увидеть, часть характеристик относится к искаженным частям тела, искаженным глазам, пальцам и так далее. Чаще всего негативный промпт даже больше основного.
Помощь с написанием промптов
К счастью, не все так страшно, как может показаться. Ведь есть и сервисы для генерации промптов.
MidJourney Prompt Helper
В первую очередь сервис ориентирован на нейросеть MidJourney, которую разберем ниже. Сейчас нас интересует возможность, которую он предоставляет, а именно превью некоторых не особо понятных на слух параметров. Например, стиль определенных артистов, линза фотообъектива, освещение и материалы.
Clip Interragator
Отличный сервис, если у вас есть подходящий референс для предстоящей работы. Принцип работы максимально простой – вставляете файл, выбираете качество оценки фотографии, ждете и получаете желаемый результат.
Lexica.art
Главный смысл этого ресурса – галерея вдохновения. Сайт предоставляет огромную подборку работ пользователей с открытыми промптами и настройками. Увидели что-то цепляющее глаз – зашли и скопировали.
Побочная функция ресурса – встроенный быстроработающий генератор изображений. Удобно для тестирования созданных промптов, так как выполняет запросы почти без очереди и с обширным количеством настроек. Приятным бонусом ко всему этому идет возможность использование вашего изображения для направления работы нейросети.
Уже этого уровня в принципе достаточно для использования созданных изображений в качестве иллюстраций, но это зависит от ваших требований. Большим минусом этого генератора является довольно неадаптивная модель, которую он использует для создания картинок. Так что тестируйте, но не забывайте и про другие доступные варианты.
Русскоязычные нейросети от Яндекс и Сбербанк
Не так давно наткнулся на Шедеврум в рекламе и после того, как удостоверился, что проект действительно от Яндекса решил проверить лично. Результатом остался приятно удивлен, а во время написания статьи обнаружил для себя и такую вещь, как Kadinsky от Сбербанк.
Плюсы/Минусы
- Русскоязычный интерфейс. Всегда удобнее работать на родном языке.
- Свежая адаптивная модель. Изображения адаптируются под запрос и выглядят по-разному, хотя иногда ради эффекта придется постараться. Приятный бонус – модель отличается от генерации других нейросетей, так что спутать ее изображения сложно.
- Разрешение изображения. Спорный пункт для Шедеврума, так как в данный момент нейросеть предоставляет изображения в формате 256х256. Kadinsky в свою очередь генерирует картинки вплоть до 764х764.
- Скорость генерации. Редко когда придется ждать больше минуты.
- Функционально. (Касается только Kadinsky) В веб-версии можно генерировать изображения и дорисовывать пользовательский файл. В боте в Телеграм доступны также смешивание двух разных изображений и смешивание текста и изображения.
- Бесплатно. Казалось бы, не особо важный факт, но приятное дополнение.
Как воспользоваться?
Шедеврум работает на базе отдельного приложения, которое можно найти в Google Play или AppStore.
Воспользоваться Kadinsky можно несколькими способами:
- В официальном телеграм-боте
Виновники торжества
И начнем со слона в посудной лавке, о котором уже все знают и наслышаны. Представляем вашему вниманию великий и ужасный MidJourney.
MidJourney
Одна из самых популярных нейросетей с огромным количеством пользователей. Не так давно вышло обновление до пятой версии и ее прогресс не перестает удивлять.
Из-за большого опыта, накопленного пользователями, нейросеть делает очень реалистичные изображения и способна переключаться от одного стиля к другому. Именно здесь вам пригодится описанный выше MidJourney Prompt Helper, чтобы оценить все доступные возможности.
Плюсы/Минусы
- Англоязычный интерфейс. Немного усложняет использование, но в эру онлайн-переводчиков не составляет проблему.
- Огромное количество пользователей. Генерация обучена миллионами запросов и может подстроиться под любое требование.
- Бесплатно. Но с оговорками. Бесплатно генерировать можно только используя общий чат и ограниченное количество изображений. В периоды особой нагрузки генерирование без подписки может быть невозможным.
- Скорость генерации. Если использовать бесплатную версию, то изображение будет готов в течение нескольких минут.
- Разрешение. Позволяет генерировать изображения в формате до 1024х1024. Но генерация изображений высокого качества тратит больше доступных действий бесплатного периода.
Как пользоваться?
- Выберите любой чат слева с названием newbies-#
- Либо скопируйте необходимый промпт из сервиса MidJourney Prompt Helper, либо введите команду /imagine promt:#ваш текст#
Также можно контактировать с ботом MidJourney в Discord напрямую, но доступна эта функция только подписчикам сервиса. Ниже вы можете ознакомиться со стоимостью ежемесячных и годовых подписок.
StableDiffusion
Персональный любимчик. Практически все иллюстрации я делаю через него и опыта работы со StableDiffusion у меня больше всего.
С официального сайта можно воспользоваться двумя главными функциями: онлайн-генератор изображений и поиск работ других пользователей по ключевым словам. Немного о последнем.
В отдельном разделе сайта в поисковой строке вводим любое слово на английском и получаем пользовательскую галерею с введенными при создании промптами. Находим то, что нам подходит и копируем текст, слова или промпт целиком.
Теперь можно переходить к генерации изображений и разобрать все по пунктам.
Плюсы/Минусы
- Англоязычный интерфейс. Кто-то может оставить идею пользования StabbleDiffusion уже на этом моменте, но советую переселить себя и протестировать на своем опыте.
- Одна из самых опытных адаптивных моделей. Может подстроиться практически под любой запрос и под все критерии. Считывает большое количество промпта.
- Разрешение. Позволяет генерировать до 4ех изображений одновременно в формате 512х512.
- Скорость генерации. В среднем ожидание занимает около минуты, но в пиковое время онлайна (не по времени РФ) может занимать и больше времени.
- Простота интерфейса. И плюс и минус, легко разобраться, но в онлайн версии отсутствует редактирование изображений и использование изображения в качестве референса. Также, в периоды повышенной активности отключается возможность ввода негативного промпта.
- Бесплатно. Неожиданно, учитывая количество функционала и его качества.
Как пользоваться?
Есть два способа: простой и над которым нужно потрудиться, но результат вам понравится больше.
Первый – Stabble Diffusion Online на официальном сайте проекта. На него действуют ограничения 14+ и необходимо ждать свою очередь для генерации.
Второй – установить Stabble Diffusion локально себе на компьютер, что открывает огромное количество возможностей: редактирование изображений через генератор, жестокий контент (кровь и тп.), использование различных моделей, в том числе и натренированных вами.
Но, чтобы осуществить второй способ, придется немного потрудиться. После выпуска этой публикации начну работу над статьей касательно данной темы. Я сам постепенно переезжаю на этот способ генерации.
Приятный постфактум
В завершении хотелось бы рассказать также и о нескольких сервисах, которые помогут вам улучшить полученные работы. Можно воспользоваться Photoshop и подправить неровности нейросети, но сейчас не об этом.
Вы могли заметить, что большинство продемонстрированных генераторов работают в довольно малом разрешении. Для исправления этого можно воспользоваться любым онлайн-сервисом по запросу Upscale AI. Я же при работе с телефоном использую Img.Upscaler. Выполняет задачу быстро и качественно.
Для тех же, кто планирует работать преимущественно за ПК и ищет вариант НЕбраузерного сервиса, может подойти Upscayl – опенсорс программа, работающая на Linux, Windows и MacOS.
На сегодня это все! Спасибо за прочтение, буду рад обсудить эту тему с вами в комментариях и ответить на любые вопросы. Все высказанное здесь является личным мнением человека, который сам только погружается в данную тематику.