«Создай мир во всем мире»
— Результат генерации по запросу "Создай умир во всем мире", стиль: artstation
Я поняла ваш интерес к теме картинок созданных нейросетью и сегодня поделюсь парочкой секретов, как создать текстовый запрос так, чтобы картинка не была совсем уж убогой.
Сразу скажу, я не эксперт в нейросетковых шедеврах, но картинки в последнее время предпочитаю делать в боте Kandinsky 2.2:
- Быстро
- Симпатично
- Уникально
У бота много возможностей, но я даже не пыталась использовать все — для моих трех требований хватает генерации по тексту. Но первые картинки были у меня намного хуже, потому что я использовала только пару слов и получала то, что получала.
А если слов будет чуть больше, то разница в результате будет ощутимей. Смотрим на примерах:
1️⃣ Используем ключевое слово — предмет, который надо изобразить на картинке. Например, енот.
*Во всех примерах с енотом я выбираю в боте «без стиля» и размер 3:2
2️⃣ Если дописать глагол обозначающий действие предмета, то получится уже интереснее. Енот прыгает:
3️⃣ Прилагательные помогают еще точнее конкретизировать. Большой пушистый розовый енот прыгает:
Собственно, это все советы, которые я нашла в интернете по составлению запросов. Вам нравятся эти картинки? Мне нет! Сколько бы уточнений относительно объекта я не напихивала, получалась примерно такая ф.и.г.н.я.
А если подумать?
Все эти запросы объединяет один момент — требования только к объекту, а остальное — на усмотрение нейросети. Но фишка в том, что ИИ нужны рамки — чем жестче, тем лучше. И запрос должен содержать не только описание предмета изображения, но и требования к самой картинке. Часть из них, например, стиль, можно выбрать в боте. Но лучше задать тон текстом.
Правило «ЧТО и КАК»
По сути от нас требуется объяснить боту ЧТО именно изобразить и КАК это должно выглядеть. Чем точнее, тем лучше:
«Большой, пушистый, розовый енот с зелеными глазами, прыгает через фиолетовую реку. Стиль: аниме»
Интереснее, правда? Главное, не накидывать лишних слов, которые запутают ИИ.
Давайте создадим иллюстрацию к этой статье, чтобы и смысл передавала и сочеталась с другими публикациями.
Для сочетания просто всегда выбирайте один и тот же стиль в боте.
Итак, что нам надо изобразить: «искусственный интеллект создает изображения. Стиль: техно-мистика».
Только понятие «искусственный интеллект» очень абстрактное, поэтому я уточню.
И маленькая, но важная подсказка:
Запрос любой нейросети должен быть в форме обращения, точнее, команды
— «создай картинку, где девушка с искусственным интеллектом работает перед монитором. Стиль: техно-мистика, синий цвет».
Или вот так:
«Создай картинку, где робот с искусственным интеллектом работает перед монитором. Стиль: техно-мистика, цвет: синий с розовым акцентом»
Мне картинка с девушкой нравится больше, поэтому основной оставлю ее. Но зато вы наглядно видите, как пара деталей влияют на результат.
Кстати, с текстами для читателей такая же особенность — конкретика облегчает понимание. И с запросами к ИИ по написанию текста правило «ЧТО и КАК» тоже работает.
Короче, ничего сложного, если представить, что ИИ — твой сотрудник, которому в двух словах смской надо объяснить, что сделать.
Только нейросеть сделает это за считанные секунды. Удобно!
Хотите расскажу, кому принадлежат авторские права на картинки, сгенерированные ИИ?