2 подписчика

Легко, Великолепно: Новый Подход к Творчеству, или Генерация изображений нейронными сетями [для начинающих]

13 января 202413 янв 2024

5 мин

Оглавление

Теория - если хочется знать, как работает зеркало, прежде чем смотреть в него. Если лень читать, лучше сразу пролистать вниз до раздела "Практика"
Практика - Поехали, оператор нейросети!
Советы для второй и последующих итераций создания:

Если еще не испытали на себе, каково это - быть оператором нейросети, которая генерирует изображения - то многое упускаете.

Хорошая новость: у вас есть все, чтобы попробовать прямо сейчас.

Хорошая новость - 2: если умеете кликать мышкой на ссылки и пользоваться основной функцией клавиатуры - этого вполне достаточно.

Теория - если хочется знать, как работает зеркало, прежде чем смотреть в него.
Если лень читать, лучше сразу пролистать вниз до раздела "Практика"

Тип #нейросети, специализирующейся на обработке и анализе изображений, называется Convolutional #Neural Network (#CNN) или свёрточная нейронная сеть. CNN разработаны так, чтобы эффективно работать с визуальными данными, и они стали основой для многих приложений в компьютерном зрении, таких как распознавание объектов на изображениях, классификация изображений, сегментация изображений и многое другое. Эти нейросети имеют специальные слои, называемые свёрточными слоями, которые позволяют им изучать характеристики и особенности изображений.

Весь процесс работы такой сети можно разделить на 3 этапа, причем пользователь/оператор участвует только в последних двух из них -

1. Обучение нейросети

Этим этапом управляют разработчики - нейросеть подвергается обширной тренировке на большом объеме изображений. Каждое изображение разбивается на пиксели, и нейросеть изучает связи между цветами пикселей и объектами на картинке. Этот процесс основан на математических алгоритмах и оптимизации параметров нейросети, и может занимать достаточно много времени.

2. Начало работы с запросом пользователя

Например, если пользователь запрашивает "закат на океане", нейросеть применяет свое понимание, что закат обычно ассоциируется с оранжевым и красным цветами, а океан - с голубым. Сначала создается пустой холст, как пустой лист бумаги. Затем добавляются цвета и формы.

3. Как получается результат

Генерация изображения - это последовательный процесс, в котором нейросеть постепенно добавляет детали на холст. Например, она начинает с неба, затем добавляет солнце, море и другие элементы. Каждый элемент определяется на основе статистики и знаний, полученных нейросетью во время обучения. Этот процесс требует интенсивных вычислений и математических операций.

В итоге, после завершения процесса генерации, у нас есть готовое изображение, созданное нейросетью. Этот метод комбинирует техническую экспертизу и математическую обработку данных для создания визуальных произведений искусства, которые удивительно реалистичны и красочны.

Это изображение сгенерировала уже другая нейросеть, DALL-E

Практика - Поехали, оператор нейросети!

Вот #FusionBrain, которую я использую каждый день - в том числе, чтобы создать изображения для этого поста. Начнем с нее - быстрая регистрация, приятный интерфейс и #бесплатный доступ [на момент выхода статьи] - то что нужно для первого раза.

Кроме того, есть генерация #видео - и это лютый каеф, просто посмотрите на главной странице FusionBrain демо с "котоблаком" и вдохновитесь создать свое видео 🐱.

1. Заходите по ссылке, регистрируйтесь, если аккаунта еще нет

2. Попадаете в редактор

3. Вводите в поле текст-описание того, что хотите увидеть (это называют - промпт/#prompt)

4. Можно также указать текстом на то, чего на картинке быть не должно - (негативный промпт). Но это необязательно.

5. Жмете на зеленую кнопку "генерировать", ожидаете результат

6. Получаете изображение, которое можно сохранить

Советы для второй и последующих итераций создания:

1. Используйте по возможности более конкретные обороты, которые определяют цвета и формы - "Синий", "Лев", "Пустыня", "Квадратный", "Острый" - это может существенно влиять на результат. На результат может влиять язык промптов - ENG пока считается предпочтительным.

2. Нейросеть интерпретирует и более сложные образы - "Уютный", "Беспокойный", "Мягкий и теплый свет" и так далее. Экспериментируйте с промптами и стилями в свое удовольствие.

3. Некоторые нейросети работают не только с текстом - могут генерировать изображения, например, и из других изображений (p2p). Один из самых популярных примеров таких сетей - #Midjourney или #DALL-E . Эта фича позволяет проводить каскад преобразований с одним изображением - трансформировать его итеративно.

4. Разнообразие возможностей со временем поразит воображение - нейросети могут симулировать эффекты различных кинопленок, объективов, художественных приемов, цветокоррекции и монтажа и прочее и прочее, но в нашей статье - мы лишь прикасаемся к промптингу, как необходимому инструменту для начала работы.

5. Чем глубже вы изучите нейросети, чем лучше овладеете промптингом - тем более выразительные, эффектные и точные слепки вашего воображения у вас получится генерировать.

6. Нейросеть может существенно помочь в профессиональном плане - для иллюстрирования, дизайна, рабочего вдохновения и т.д.

Изучите и используйте несколько сетей последовательно, чтобы получить максимально эффектный/эффективный результат

Важно! Есть определенные правила, о существовании которых лучше знать с самого начала. Мы лишь кратко коснемся их, чтобы знать о существовании таких правил в принципе. Изучить их лучше подробно и отдельно для каждого конкретного инструмента.

1. У большинства нейросетей есть ограничения на создание контента определенной тематики, установленное владельцем платформы. Это значит, интерфейс редактора ответит отказом - в случаях, когда оператор попытается создать изображение, которое нарушает эти правила.

2. Достаточно тонким может оказаться момент с авторскими правами на сгенерированный контент.
На момент написания статьи, у меня есть понимание, что в некоторых случаях практика, которая применяется - изображения принадлежат непосредственно создавшим их операторам/владельцам аккаунтов.
Однако, вероятно, есть исключения, или что-то может измениться. Важно уточнить этот момент - особенно, если собираетесь использовать изображения в коммерческих целях.

Кстати, это и другие изображения из статьи - принадлежат автору =)

Помните самое главное - в работе с нейросетью нет существенных рамок, которые ограничивают возможности оператора в создании визуальных образов.

Можно увидеть почти все, что возможно представить и описать словами.

а Альберт Эйнштейн однажды сказал: "Воображение — это самое главное, оно является отражением того, что мы притягиваем в свою жизнь."

Успехов, друзья!

Так DALL-E показала корабль "Синяя Чайка" капитанов Кима и Бурана, из советского мультфильма "Тайна Третьей планеты". Обратите внимание, как близко к атмосфере мультика передан ландшафт планеты миражей.

______________
Приходите в ТГ канал
#ментормакс #дзен #dzen