Резюме
Освоение четких и детализированных запросов — ключ к генерации ИИ-изображений с помощью ChatGPT. Но как работают запросы и как мы можем их улучшить?
Основы
Запросы для ИИ в целом работают наиболее эффективно с ясными структурированными формулировками. Для ИИ-изображений всегда важно указать предмет или основное внимание изображения, а также контекст и детали, а также предоставить информацию о стиле и эстетике (например, художественном стиле). Однако это не все, что мы обсудим в этом руководстве, в том числе и запросы, которые вы можете модифицировать самостоятельно.
Я буду использовать ChatGPT (DALL-E) для генерации своих ИИ-изображений, но вы можете использовать и другие инструменты, такие как Midjourney или Stable Diffusion — они все разные!. Вам нужно быть подписчиком ChatGPT Plus, чтобы по-настоящему поэкспериментировать с генерацией изображений ИИ. Однако как бесплатный пользователь вы получаете две генерации изображений в день. Генерация изображений с помощью ИИ требует значительных ресурсов и не является бесплатной.
Используйте естественный, разговорный язык
В целом, лучше использовать разговорный и простой язык, когда вы создаете свои запросы. Чем более конкретным и ясным вы будете с запросом, тем лучше будут ваши результаты. Поскольку ChatGPT — это чат-бот, он был обучен, как люди общаются в разговоре, а также понимает контекст.
Все генераторы изображений на основе запросов понимают естественный язык, но не все делают это одинаково хорошо, поэтому ваши результаты могут варьироваться в зависимости от сложности инструмента.
Является ли более длинный запрос всегда лучшим?
Важно отметить, что некоторые генераторы изображений ИИ хорошо работают с длинными запросами (более 50 слов), в то время как другим лучше подходят короткие запросы (10-20 слов). Хорошей идеей будет протестировать разные длины, чтобы выяснить, что лучше всего подходит для каждого инструмента, исходя из ваших уникальных требований. Я обнаружил, что ChatGPT лучше функционирует с более прямыми и детализированными запросами. Чем более конкретным и ясным вы будете, тем лучше.
Слишком сложные или многословные запросы могут иногда запутать ИИ. Здесь важен баланс — подробные, но ясные запросы, которые работают наиболее эффективно.
Тем не менее, лучше избегать использования терминов, имеющих противоречивые значения, так как это может сбить с толку генератор ИИ. Например, использование слов "яркий" и "ночь" может иметь разные значения.
Пример короткого запроса:
Создайте изображение игривого серого кота в парке при дневном свете.
Вот сгенерированное изображение:
Пример длинного запроса:
Игривый тёмно-серый кот с мягкой, пушистой шерстью резвится в зелёном парке под тёплыми солнечными лучами. Кот гоняется за порхающей бабочкой рядом с клумбой диких цветов. Солнечный свет мягко фильтруется сквозь деревья, создавая мозаичные тени на земле. Настроение – весёлое и живое, с реалистичным гиперреалистичным, естественным стилем и общим планом.
Вот сгенерированное изображение:
Придерживайтесь конкретных существительных для основного объекта
Когда дело касается описания основного объекта, вам следует использовать более конкретные существительные и предметы, которые можно увидеть, такие как живые или материальные вещи, или места. Нет, это не только то, что можно увидеть, но и все, что можно ощутить пятью чувствами.
Тем не менее, более абстрактные концепции, такие как "счастье", "просветление" и "страх", допускают более творческое выражение, но сгенерированное изображение будет менее вероятно соответствовать любому вашему видению. Поэтому лучше комбинировать эти термины с более специфической лексикой.
Используйте описательный язык
Следующий шаг — добавить контекст и детали не только к вашему объекту, но и к тому, как вы хотите, чтобы выглядел фон. Легкий способ добавить контекст и детали — рассмотреть три ключевых элемента:
Вы можете добавлять прилагательные, чтобы придать вашим изображениям больше глубины. Когда дело касается прилагательных, лучше добавить пару, чтобы не перегружать запрос, чтобы лучше соответствовать визуалам, которые вы хотите сгенерировать.
Используйте приведённые примеры для каждой категории в качестве ориентира, чтобы помочь вам создать свой запрос:
Простой запрос:
Создайте изображение улицы с велосипедистом, катающимся по ней.
Вот сгенерированное изображение:
Улучшенный запрос с прилагательными:
Уютная мощеная улица в европейском деревне, вдоль которой выстроены дома пастельных тонов, украшенные цветочными ящиками. Утренний солнечный свет отбрасывает мягкие тени, а велосипедист неспеша катится по улице. На углу размещено кафе с столиками на улице, приглашающее прохожих. Настроение – весёлое, приглашающее и ностальгически тёплое.
Вот сгенерированное изображение:
Не забывайте о композиции
Композиция — важная часть создания визуально эффектных изображений, так как она формирует, как элементы упорядочены и как объект воспринимается зрителем. Например, вы можете использовать "крупный план", "средний план", "общий план" или "точка зрения", чтобы уточнить угол и расстояние. Предоставляя детали композиции, изображение с большей вероятностью будет соответствовать вашему видению.
Простой запрос:
“Создайте изображение льва в дикой природе.”
Вот сгенерированное изображение:
Улучшенный запрос:
“Изображение общего плана царственного льва, отдыхающего на солнечном камне в дикой природе, окруженного золотой саванной. Сцена передает мягкое свечение заката, а небо раскрашено в оттенки оранжевого и розового. На горизонте пунктирные акации, а нежный ветер колышет высокую траву. Настроение — мирное, но мощное.”
Вот сгенерированное изображение:
Понимание творческих ограничений
Так же, как генерация текста с помощью ИИ имеет свои пределы, существуют и ограничения ИИ в генерации изображений и креативности. Ему не хватает человеческой перспективы, а также личного опыта и эмоций. Поскольку оно обучено на основе данных (в основном, онлайн данных) и правил тренировки, ИИ ограничено качеством, человеческой глубиной и разнообразием данных, используемых в его обучении.
На мой взгляд, настоящей оригинальности нет. В отличие от людей, которые могут выражать себя необычными способами, ИИ может быть хорошим инструментом, который работает наряду с человеческим творчеством.
Генерация изображений с помощью ИИ — это не магия, но с помощью продуманных, точных запросов она кажется близкой. Погружайтесь, экспериментируйте и позволяйте этим инструментам подпитывать ваше творчество, а не заменять его.
Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!
Новинка! На нашем канале в Яндекс Дзен появилась премиум подписка, которая позволяет читать статьи без рекламы и получать доступ к эксклюзивным материалам, недоступным обычным пользователям. Будем рады, видеть вас в числе премиум пользователей!
🏕️ Любите активный отдых на природе? Подписывайтесь на канал Поход лайфхак в Яндекс Дзен — кладезь полезных советов для любителей активного отдыха!
Вы также можете читать наши материалы в:
- Telegram: https://t.me/gergenshin
- Яндекс Дзен: https://dzen.ru/gergen
- Официальный сайт: https://www-genshin.ru