Задача была амбициозная: сделать красиво, в стиле стимпанк-дизельпанк и не похоже на стоковый стиль Midjourney. К слову, представление о стимпанке у нейросети местами ограниченное. Вы можете в этом убедиться. На изображении 1 результат запроса:
«Squadron combat steampunk air fortresses». (Эскадрилья военных стимпанк воздушных крепостей). Как видите, результат похож на ржавые бочки или игрушечные дирижабли.
Поясню: как я и говорил в одном из предыдущих постов, у нейросети весьма угловатое восприятие одних и тех же запросов. Как бы я ни крутил промт про воздушный флот в стиле стимпанк, это ВСЕГДА БЫЛИ ДИРИЖАБЛИ. Крепости ли ты указываешь, крейсеры, или просто "корабли". Всегда одно и то же. Стимпанк? На тебе дирижабли.
Решаем проблему
Тогда я скормил ИИ один из постеров к игре HighFleet в качестве референса (изображение 2):
Но этого было недостаточно — получилось изображение 3:
В ход пошла тяжелая артиллерия
Пришлось ещё ковыряться в запросе и расставлять акценты специальными командами. Среди них:
:: (Цифра) — позволяет одному из слов придать больше веса, чем другому.
--no (Слово) — нейросеть по возможности исключит это из результата. Но это не точно =)
В дополнение к референсу я расширил запрос и накинул ИИ пару идей, таких как: небо и облака в качестве бэкграунда, количество объектов и несколько стилистических отсылок. Отдельной командой я попросил не опираться на объект «дирижабли»:
«Squadron of 6 combat airships:: 3 flying in the sky, matrix style, steampunk style, smoke, clouds, morning, general shot, highly detailed, realistic, --no dirigible» — Эскадрилья из 6 боевых воздушных кораблей летит в небе, стиль матрицы, стимпанк стиль, дым, облака, утро, общий план, высокодетализировано, реалистично, нет дирижаблей. Соотношение 3: 2.
Что получилось:
Неплохо, но угловато и топорно, да еще и текст откуда-то взялся (а мы знаем откуда — избегайте надписей на референсах, которые скармливаете ИИ). Но прогресс налицо. После нескольких дополнительных генераций нейросеть начала понимать, чего я от нее хочу.
И тут сразу стоит сказать — в зависимости от референсов можно было крутить результат как хочешь. Я мог пойти и дальше, но уж очень мне понравился результат, которым делюсь ниже. В будущих постах постараюсь показать, как в подобных условиях нейросеть работает с другими стилями.
Что в итоге?
Лично меня результат очень впечатлил. С большим удовольствием я разглядывал массивные диковинные тушки кораблей, местами похожих на дирижабли, но без излишней ржавости и не утрировано. А где-то получились потрясающие атмосферные крейсеры в стиле дизельпанк. Наслаждайтесь:
Читайте также.