Миджорни озадачил. Эксперименты и выводы. С промптами.

568 прочитали
Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.

Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.

Для справки: Миджорни (Midjourney) — самая популярная нейронная система, генерирующая изображения по текстовому описанию (промпту).

Два факта:

— нейронки а-ля ChatGPT сейчас поднялись на очень высокий уровень.

— ожидал, что корректно написанные промпты для Миджорни будут удовлетворительно отрабатывать.

На примере иллюстрирования своей статьи Нейронные сети: у истоков новой цивилизации показываю и рассказываю, что я делал. И какие нестыковки при этом обнаружил.

Иллюстрации для статьи

Для статьи я решил сгенерить с помощью Midjourney 4 картинки:

1) Картинку, иллюстрирующую персонажа с профессией, находящейся под угрозой исчезновения.

2) Изображение персонажа с новой, возникающей профессией.

3) Картинку, иллюстрирующую персонажа с новой, возникающей профессией.

4) Заставку — что-то достаточно абстрактное, где присутствовали бы:

  • человек,
  • компьютер(ы),
  • человеческий мозг,
  • что-то, напоминающее сеть.

Не обязательно все.

Привожу иллюстрации того, что меня поначалу повергло в удивление. В формате: Получил Ожидал.

Ожидаемое вызывается по клику на ссылке. Специально спрятал. Чтобы вы вначале оценили картинки, попытались угадать, какая же была задумка. И только потом сравнили с тем, что задумывалось и увидели контраст.

Вводные

Что: Midjourny, v. 5.1

Суть: Генерация картинок на основе промптов.

Промпты.

Сначала насмотрелся и начитался всяких примеров о структуре промптов. Составил описание предполагаемой композиции картинки на русском. Попросил ChatGPT перевести на английский в стиле промпта для Midjourny. Нейронки понимают язык оригинала лучше, чем русский.

В дальнейшем для мелкой доработки картинки промпты корректировал сам. Иногда для более точной формулировки обращался к ChatGPT.

Поясню почему промПт, а не промт — пока термин особенно не устаканился, предпочитаю брать за основу англоязычный вариант (prompt), а не вариант людей, плохо знающих английский.

Мы с English — хорошо дружим. Недопониманий не было. Поэтому качество промптов (если даже в этом дело) нужно принимать во внимание в последнюю очередь.

Итак, начали.

Первая картинка представитель одной из исчезающих профессий

Почтальон

1. Сгенерировано (первая попытка):

1
1
2
2
3
3
4
4

Клик 👇 чтобы увидеть промпт и ожидание от его выполнения

Что ожидал увидеть

Что увидел?

Не подходит. Идем на вторую попытку.

=================================================

2. Сгенерировано (вторая попытка, Flat Design):

Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-6
Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-7
Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-8
Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-9

Клик 👇 чтобы увидеть промпт и ожидание от его выполнения

Что ожидал увидеть

Что увидел?

Не подходит. Берем другой персонаж.

=================================================

Библиотекарь

3. Сгенерировано (первая попытка, Minimalist Style):

1
1
2
2
3
3
4
4

Клик 👇 чтобы увидеть промпт и ожидание от его выполнения

Что ожидал увидеть

Что увидел?

Не подходит. Идем на вторую попытку.

=================================================

4. Сгенерировано (вторая попытка, Flat Design):

Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-14
Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-15
Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-16
Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-17

Клик 👇 чтобы увидеть промпт и ожидание от его выполнения

Что ожидал увидеть

Что увидел?

Нестыковки:

  • Это еще далеко не 40-летняя женщина, как написано в промпте.
  • Книжные шкафы/полки есть только на 4-й картинке.
  • Обратите внимание на фон — вместо тесной комнаты — какая-то улица? И тени в воздухе — то ли летающая фанера, то ли вороны...

НО — это почти то, что нужно!

Вывод: последняя картинка вполне подходит в качестве абстрактной иллюстрации библиотекаря.

=================================================

Вторая картинка представитель одной из возникающих профессий

Промпт-инженер

5. Сгенерировано:

Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-18
Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-19
Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-20
Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-21

Клик 👇 чтобы увидеть промпт и ожидание от его выполнения

Что ожидал увидеть

Что увидел?

Любая картинка подойдет для статьи.

=================================================

Третья картинка представитель одной из возникающих профессий

Нейрокопирайтер

5. Сгенерировано:

Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-22
Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-23
Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-24
Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.-25

Клик 👇 чтобы увидеть промпт и ожидание от его выполнения

Что ожидал увидеть

Что увидел?

Сгенерированные картинки похожи одновременно и на человека, и на робота. Берем любую.

Нестыковка: в промпте был заказан белый фон, а его нет.

=================================================

Четвертая картинка — фантазия на тему слияния человека и машины

Хотелось, чтобы была смесь человеческого и машинного. Например, лицо человека, глядящего прямо вперед с вызовом и оплетенное сеткой нейроноподобных элементов.

6. Сгенерировано (много попыток):

Привожу отдельные картинки с разными промптами.

1
1
2
2
3
3
4
4
5
5
6
6
7
7
8
8

Клик 👇 чтобы увидеть промпт и ожидание от его выполнения

Что ожидал увидеть

Что увидел?

Проведенные эксперименты не позволили получить желаемое.

Тема отложена на будущее время.

Четвертая картинка - заставка

7. Сгенерировано:

1
1
2
2
3
3
4
4
5
5

Клик 👇 чтобы увидеть промпт и ожидание от его выполнения

Что ожидал увидеть

Последняя картинка была взята в статью.

Нестыковки

Цвет фона (background) часто не соответствовал затребованному. Возможно, синтаксис промпта был не совсем корректный.

В последней серии картинок вместо сети компьютеров показаны свисающие с потолка скорее лампы, чем мониторы.

Пол на многих изображениях какой-то разрушенный, с отдельными сохранившимися плитами.

Кое-где на потолке встречается проем явно разрушающегося, неприглядного вида.

Не все ключи промпта совместимы друг с другом. Некоторые зависят от версии Midjourney. Поэтому пришлось от большинства отказаться.

В результате применялся только ключ указания соотношения сторон изображения ar.

Не сработали ключи: chaos, test, testp, niji.

Midjourney путается. Пример: хотел сгенерить робота, печатающего на клавиатуре за компом, на мониторе которого показан человеческий мозг с разными цветными сегментами. Получил картинки, похожие на те, которые были в серии № 6. Видимо, для MJ слова human brain и neural (человеческий мозг и нейронный, нервный) все являются одной нейронной системой.

PS.

Если кликнуть по названию канала, то увидите другие статьи. Можно выбрать еще что-то интересное для себя. А для просмотра будущих статей — лучше вообще подписаться.

Имеется также постоянно обновляемый гид-путеводитель по статьям канала.

#нейросеть #нейронныесети #ИИ #AI #neuralnetworks #Midjourney #Миджорни #генерацияизображений #искусственныйинтеллект