Давно и глубоко в теме нейронок. Решил, наконец-то, поработать с Midjourney. И был неприятно удивлен.
Для справки: Миджорни (Midjourney) — самая популярная нейронная система, генерирующая изображения по текстовому описанию (промпту).
Два факта:
— нейронки а-ля ChatGPT сейчас поднялись на очень высокий уровень.
— ожидал, что корректно написанные промпты для Миджорни будут удовлетворительно отрабатывать.
На примере иллюстрирования своей статьи Нейронные сети: у истоков новой цивилизации показываю и рассказываю, что я делал. И какие нестыковки при этом обнаружил.
Иллюстрации для статьи
Для статьи я решил сгенерить с помощью Midjourney 4 картинки:
1) Картинку, иллюстрирующую персонажа с профессией, находящейся под угрозой исчезновения.
2) Изображение персонажа с новой, возникающей профессией.
3) Картинку, иллюстрирующую персонажа с новой, возникающей профессией.
4) Заставку — что-то достаточно абстрактное, где присутствовали бы:
- человек,
- компьютер(ы),
- человеческий мозг,
- что-то, напоминающее сеть.
Не обязательно все.
Привожу иллюстрации того, что меня поначалу повергло в удивление. В формате: Получил — Ожидал.
Ожидаемое вызывается по клику на ссылке. Специально спрятал. Чтобы вы вначале оценили картинки, попытались угадать, какая же была задумка. И только потом сравнили с тем, что задумывалось и увидели контраст.
Вводные
Что: Midjourny, v. 5.1
Суть: Генерация картинок на основе промптов.
Промпты.
Сначала насмотрелся и начитался всяких примеров о структуре промптов. Составил описание предполагаемой композиции картинки на русском. Попросил ChatGPT перевести на английский в стиле промпта для Midjourny. Нейронки понимают язык оригинала лучше, чем русский.
В дальнейшем для мелкой доработки картинки промпты корректировал сам. Иногда для более точной формулировки обращался к ChatGPT.
Поясню почему промПт, а не промт — пока термин особенно не устаканился, предпочитаю брать за основу англоязычный вариант (prompt), а не вариант людей, плохо знающих английский.
Мы с English — хорошо дружим. Недопониманий не было. Поэтому качество промптов (если даже в этом дело) нужно принимать во внимание в последнюю очередь.
Итак, начали.
Первая картинка — представитель одной из исчезающих профессий
Почтальон
1. Сгенерировано (первая попытка):
Клик 👇 чтобы увидеть промпт и ожидание от его выполнения
Что увидел?
Не подходит. Идем на вторую попытку.
=================================================
2. Сгенерировано (вторая попытка, Flat Design):
Клик 👇 чтобы увидеть промпт и ожидание от его выполнения
Что увидел?
Не подходит. Берем другой персонаж.
=================================================
Библиотекарь
3. Сгенерировано (первая попытка, Minimalist Style):
Клик 👇 чтобы увидеть промпт и ожидание от его выполнения
Что увидел?
Не подходит. Идем на вторую попытку.
=================================================
4. Сгенерировано (вторая попытка, Flat Design):
Клик 👇 чтобы увидеть промпт и ожидание от его выполнения
Что увидел?
Нестыковки:
- Это еще далеко не 40-летняя женщина, как написано в промпте.
- Книжные шкафы/полки есть только на 4-й картинке.
- Обратите внимание на фон — вместо тесной комнаты — какая-то улица? И тени в воздухе — то ли летающая фанера, то ли вороны...
НО — это почти то, что нужно!
Вывод: последняя картинка вполне подходит в качестве абстрактной иллюстрации библиотекаря.
=================================================
Вторая картинка — представитель одной из возникающих профессий
Промпт-инженер
5. Сгенерировано:
Клик 👇 чтобы увидеть промпт и ожидание от его выполнения
Что увидел?
Любая картинка подойдет для статьи.
=================================================
Третья картинка — представитель одной из возникающих профессий
Нейрокопирайтер
5. Сгенерировано:
Клик 👇 чтобы увидеть промпт и ожидание от его выполнения
Что увидел?
Сгенерированные картинки похожи одновременно и на человека, и на робота. Берем любую.
Нестыковка: в промпте был заказан белый фон, а его нет.
=================================================
Четвертая картинка — фантазия на тему слияния человека и машины
Хотелось, чтобы была смесь человеческого и машинного. Например, лицо человека, глядящего прямо вперед с вызовом и оплетенное сеткой нейроноподобных элементов.
6. Сгенерировано (много попыток):
Привожу отдельные картинки с разными промптами.
Клик 👇 чтобы увидеть промпт и ожидание от его выполнения
Что увидел?
Проведенные эксперименты не позволили получить желаемое.
Тема отложена на будущее время.
Четвертая картинка - заставка
7. Сгенерировано:
Клик 👇 чтобы увидеть промпт и ожидание от его выполнения
Последняя картинка была взята в статью.
Нестыковки
Цвет фона (background) часто не соответствовал затребованному. Возможно, синтаксис промпта был не совсем корректный.
В последней серии картинок вместо сети компьютеров показаны свисающие с потолка скорее лампы, чем мониторы.
Пол на многих изображениях какой-то разрушенный, с отдельными сохранившимися плитами.
Кое-где на потолке встречается проем явно разрушающегося, неприглядного вида.
Не все ключи промпта совместимы друг с другом. Некоторые зависят от версии Midjourney. Поэтому пришлось от большинства отказаться.
В результате применялся только ключ указания соотношения сторон изображения ar.
Не сработали ключи: chaos, test, testp, niji.
Midjourney путается. Пример: хотел сгенерить робота, печатающего на клавиатуре за компом, на мониторе которого показан человеческий мозг с разными цветными сегментами. Получил картинки, похожие на те, которые были в серии № 6. Видимо, для MJ слова human brain и neural (человеческий мозг и нейронный, нервный) все являются одной нейронной системой.
PS.
Если кликнуть по названию канала, то увидите другие статьи. Можно выбрать еще что-то интересное для себя. А для просмотра будущих статей — лучше вообще подписаться.
Имеется также постоянно обновляемый гид-путеводитель по статьям канала.
#нейросеть #нейронныесети #ИИ #AI #neuralnetworks #Midjourney #Миджорни #генерацияизображений #искусственныйинтеллект