Найти тему

Генерирую изображение в PlaygroundAI без негатива, или Мои эксперименты с нейросетью продолжаются

Я до сих пор обхожу стороной научные и математические дебри нейросетевого направления (хотя уже и руки чешутся), и за месяц не продвинулась дальше обычного использования площадки, которое описала здесь по шагам:

Да. Может это не совсем технично, с такой то скоростью, но зато «экологично». У меня полноценная оффлайн-работа и онлайн-обучения, помимо семейной деятельности.

Поэтому на данный момент я пока отработала генерацию изображений требуемого размера, детальности и тематики, с использованием различных фильтров.

Как вы могли заметить, на сгенерированных изображениях время от времени могут попадаться различные «артефакты» – нарушение пропорций, лишние объекты и т.п., ведь результат нейросетевой генерации случаен и не всегда последователен.

Помочь в этом случае может использование негативных подсказок. Как пишет автор видео с туториала: «Это не предотвратит уродства, но поможет свести их к минимуму».

Для экспериментов я выбрала свою любимую фразу про красивую девушку у моря, перевела её на английский с помощью Яндекс Переводчика, вписала слева в поле «Prompt» и нажала в левом нижнем углу на кнопку «Generate»:

Далее включаю опцию «Exclude from image» (исключить из изображения) (1) и ввожу в поле то, что не нужно отображать на изображении, например: деформированные конечности, двойные головы, дополнительные руки и ноги.

По этой ссылке расположен туториал, в описании которого есть ссылка на документ гугл с распространенными негативными подсказками , надеюсь я правильно скопировала ссылку, но дублирую здесь:

Скрин документа с негативными подсказками
Скрин документа с негативными подсказками

Подкорректировав список негативных подсказок, я вставила его в поле «Exclude from image».

Если навести на рисунок курсор мыши, то появляются разные группы кнопок:

  1. Плюсик - для создания вариаций. Рядом кнопка загрузки
  2. Раскрывает меню действий, дублирующих многое на экране, запомним эту кнопку
  3. Кнопки оценки изображения - понравилось ли мне то, что сгенерировала нейросеть – это даст пищу аналитике в части оценки работы разработчика
Здесь нажимаю на плюсик (1)
Здесь нажимаю на плюсик (1)

Если нажать на плюсик, то изображение перенесется в область «Image to image» (изображение к изображению). Теперь, после нажатия на кнопку «Generate», нейросеть будет копировать изображение и создавать похожие вариации – будет иметь схожую композицию и отличаться деталями.

Опция «Image strength» (сила рисунка) позволяет регулировать силу вариаций:

  • если сдвинуть влево (уменьшить), то вариации будут более креативными. Композиция сохранится, но нейросеть нафантазирует больше по своему разумению
  • если сдвинуть вправо (увеличить силу), то сходство будет больше с оригинальным изображением (того, на котором был нажат плюсик).
Отмечу, что генерация занимала больше времени, чем обычно. Улучшения меняли не только цвет и разрез глаз, выражение лица, но и периодически добавляли больше негатива, чем обычно. Я заметила, что с каждой генерацией лицо приобретало кукольные очертания идеальности. Я периодически откатывала назад, к первоначально понравившемуся изображению.

В итоге, оперируя «Exclude from image», «Image to image» и «Image strength» (в левой части окна), я получила своё желаемое, может не идеальное изображение, с нужными серёжками, выражением и цветом лица, приоткрытия глаз и морем на фоне. Это тот образ, который я не задумывала, но понравился мне при первой генерации.

Также можно поэкспериментировать с расширенными опциями - из можно установить в самом начале или когда удобно.

Нажимаю на «Show Advanced Options»:

-4

и открывается опция для «Sampler», нажимаю на стрелку вниз:

-5

Каждая из этих открытых опций по-разному дает результат: у какой-то лучше артистичность, а у какой-то фотореализм.

В телеграм боте автоматически подключается Sampler Euler - можете посмотрите на скринах код запроса здесь:

Использую и здесь его тоже.

Далее я хочу улучшить качество и размер, жму на плюсик «Actions»:

Итак, ниже делюсь получившимся изображением - лично мне очень понравился результат (послала разработчикам смайлик))). Файл из 353 килобайт (0,25 мегапикселей) разросся до 4,23 мегабайт (3,93 мегапикселей):

На этом пока остановлюсь. Продолжаю свои нейросетевые изыскания.

P.S. Вам может показаться, что мой канал про нейросети – нет, это не так. Мой канал про цифровую жизнь после 45: всё что касается IT в руках той, которой за 45 лет. Здесь про мою учебу цифровым профессиям, мой опыт и отношения с IT, впечатления и разные интересности, с которыми сталкиваюсь на своём IT-пути. Присоединяйтесь, делитесь, помогайте)))

P.S.2. Если мои публикации чем-то Вам помогают и Вы затем используете на своем канале нейросетевые генерации, то я буду безумно благодарна, если Вы будете упоминать меня или делать ссылки на эти статьи – так их увидит больше людей. Кто-то поделится своим опытом или расскажет о моих недочетах. В любом случае мне будет очень приятно видеть отклик о полезности.

P.S.3. Я использую туториал самой площадки, информацию с телеграм-каналов и т.п., а здесь просто описываю свой путь, пропуская всё через себя и свой опыт.

Особую благодарность высказываю моим первооткрывателям этой нейросетевой темы: Ученик веб-дизайнера, ныне NeuroWeb и ИгроКош – у них Вы можете найти больше полезной информации.

Всем меня комментирующим – тоже огромное спасибо! Каждый вопрос, каждое замечание или факт из своего опыта – всё идет в мою копилку, и далее – к возможной публикации с упоминанием Вас (если я где-то пропустила упомянуть – обязательно пишите, это из-за памяти).