Всем привет! Продолжаем знакомиться с нейросетями для генерации изображений.
Сегодня начнем разбирать очень неплохую по своей сути нейросеть PlaygroundAI, которая генерирует изображения по методу text to image. То есть, она преобразовывает текст в изображение. Начнем с того, что эта нейросеть, как и две другие, о которых я рассказывала раньше, условно бесплатная.
Почитать разборы других бесплатных нейросетей можно по ссылкам LEXICA и DEZGO
Однако, ее существенное отличие в том, что она дает сгенерировать гораздо большее количество изображений и гораздо быстрее.
Итак давайте рассмотрим плюсы Плейграунд, которые доступны в бесплатной версии:
- возможность генерации 1000 картинок в сутки;
- достаточно быстрая генерация сразу четырех изображений (в отличие от той же Дезго);
- наличие достаточно большого количества предустановленных стилей (фильтров), что упрощает процесс генерации;
- довольно широкий выбор размеров генерируемых изображений;
- возможность загрузить свое изображение, чтобы использовать его в качестве референса;
- возможность улучшить качество изображения;
- автоматическое исправление/улучшение лица;
- удаление фона, что иногда бывает очень полезно;
- целое пользовательское сообщество, как в Лексике, где есть возможность подсмотреть идею и запрос для нее;
- созданные вами изображения можно использовать в коммерческих целях.
Из минусов бесплатной версии:
- после 50 изображений Плейграунд автоматически начинает ограничивать качество и детализацию картинок, но для обывательских потребностей особо это роли не сыграет;
- лучше всего генерирует изображения в размере 512*512, собственно, как и все нейросети;
- созданные изображения будут видны всем пользователям нейросети;
- не доступна для использования модель Dall-E 2.
Таким образом, мы видим, что и без подписки Pro возможности работы с нейросетью достаточно широки. И этим она мне очень нравится!
Разбираемся с интерфейсом
Переходим по ссылке https://playgroundai.com/
Первым делом нужно зарегистироваться. Тут ничего сложного, если у вас имеется Гугл аккаунт. В правом верхнем углу нажимаем кнопку Sign Up. В открывшемся окошке нажимаем Continue with Google, выбираем свой аккаунт и, собственно, все, на этом регистрация окончена. При следующем входе нужно будет только нажать кнопку Create в правом верхнем углу.
Сразу же после регистрации попадаем в рабочий интерфейс. С первого взгляда может показаться, что тут все сложно и не понятно. На самом деле, все не так страшно, как кажется. Давайте разбираться по порядку, что есть что, и за что оно отвечает.
1. Filter - те самые предустановленные фильтры, с помощью которых можно добиться совершенного разной стилистики изображения: от аниме до реалистичного фото. По умолчанию фильтр не стоит, но его можно выбрать в выпадающем списке.
2. Promt - окно текстового запроса. Нейросеть понимает только английский язык.
3. Exclude From Image (исключить из запроса) - это негативный запрос, т.е. то, чего не должно быть на вашем изображении. По умолчанию эта функция выключена. Включаем тумблер и прописываем наш антизапрос в развернувшемся окне.
4. Image to Image - возможность загрузить свое изображение в качестве референса или перерисовать ранее сгенерированное.
5. Model - это модель нейросети, которая будет генерировать изображение. Есть возможность выбрать Stable Diffusion 1,5 и Stable Diffusion 2. Модель Dall-E 2 доступна только в платном режиме. Я рекомендую оставить модель Stable Diffusion 1,5 - она более стабильна.
6. Image Dimensions - размер и ориентация картинок. У Stable Diffusion лучше всего получаются квадратные картинки 512*512, потому что именно на них она была натренирована. В остальных разрешениях гораздо чаще проявляются деформации разного рода: двойные головы, дополнительные люди, задвоения. Но также можно попробовать использовать для вертикальных картинок размер 512*768, а для горизонтальных 768*512.
7. Promt Guardiance - показатель того, насколько нейросеть будет следовать вашему запросу. Оставляйте значение 7, оно оптимально.
8. Quality & Details - количество шагов, за которые нейросеть создает изображение. Оптимальный диапазон 20-30.
9. Seed - номер шума. Тут ничего не трогаем. Он должен быть случайным.
10. Columns - ползунок, который регулирует количество колонок, в которых будут отображаться сгенерированные изображениея. По умолчанию это 2 колонки.
Слева внизу кнопка Generate - генерация изображения. И справа еще немного ниже есть опция выбора количества изображений, которые генерируются за один раз - Number of Images. По умолчанию стоит 4, рекомендую так и оставить. Также не вместилась в скриншот опция Privat Session - возможность генерировать изображения только для себя, другие пользователи их не увидят. Она доступна только в платной версии.
По центру будем видеть изображения, которые генерирует нейросеть.
Генерируем первые изображения с помощью Playground
Итак, с интерфейсом разобрались. Давайте попробуем что-нибудь нарисовать. Возьмем какой-то простенький запрос. Создадим, к примеру, фото красивой девушки с близким ракурсом. Сразу же попросим детализированно прорисовать лицо, чтобы уменьшить вероятность "кривых" фото. В негативном запросе тоже прописываем стандартные модификаторы, чтобы нейросеть не выдавала изображения с обезображенными людьми. Также рекомендую прописывать тут же слово "nude" (обнаженный), потому что нейросеть публичная и не допускает генерации обнаженных тел, из-за этого могут возникать ошибки.
Promt: close up photography of a beautiful woman, highly detailed beautiful face.
Negative promt: bad amatomy, bad hands, text, black and white, watermarks, nude, unfigured, double heads.
Нажимаем Generate и вот, что получилось.
Видим, что нейросеть действительно нарисовала портреты девушек, но все они очень разные. Плюс, несмотря на негативный, запрос появились задвоения.
Давайте попробуем уточнить запрос и нарисовать более конкретную девушку с коричневыми волосами и зелеными глазами. И добавляем ей локацию "in the town" - в городе. Негатив оставляем тот же.
Мы действительно видим красивых девушек. Практически все с каштановыми волосами и зелеными глазами. Обратите внимание, нейросеть добавила по запросу "green eyes" не только зеленые глаза, но и много зелени. Однако, городской застройки нет, все девушки "в кустах".
Пробуем уточнить запрос словами tall building in the background (высокие здания на фоне) и пропишем еще intricate detailes (сложные детали), чтобы сделать изображения более интересными.
Уже намного лучше. В целом мы добились того, чтобы нейросеть выдавала нам нужные изображения. Можно сделать еще 2-3 герерации чтобы выбрать наилучший результат и уже дальше с ним работать.
Как я и писала ранее, нейросеть PlaygroundAI немного сложнее рассмотренных ранее, она уже близка к профессиональному использованию, поэтому у нее много функций. Чтобы не загружать вас большим объемом сразу, будем разбирать работу в ней по частям.
Первого блока вам будет достаточно для того, чтобы разобраться в интерфейсе и начать генерировать первые изображения. Также можете "поиграться" с фильтрами, с помощью них один и тот же запрос может быть отрисован кардинально по-разному. Вот вам пример с дракончиками. Запрос не менялся, только фильтры.
На этом пока все. В ближайшее время продолжим разбирать возможности PlaygroundAI, поэтому настоятельно рекомендую подписаться на мой канал. Дальше - больше!
PS: На каждую статью с гайдом и разбром уходит уйма времени. Поэтому, пожалуйста, поставьте лайк и напишите "Спасибо", если информация была вам полезной. Это дает мне понимание, что мои старания не напрасны и стимулирует писать больше.