В статье про модель нейросети Kandinsky 3.0 я посетовала, что новая версия не всегда генерирует четкие изображения. Если запрос предусматривает, что на переднем плане есть какой-либо объект, нейросеть формирует этот объект четким, а задний план - немного размытым. Этот прием обеспечивает объемность изображения, что, в принципе, нормально. А вот пейзажи с удаленными объектами лишены фокуса. Как получить же получить четкое, нормально сфокусированное изображение?
Например, пейзаж со следующим запросом: «холмистый лес, озеро, горы на заднем плане». Увеличьте изображение ниже. Вы увидите, что картинка размыта.
По умолчанию, то есть если в запросе не указано, какая погода, модель 3.0 чаще всего генерирует на небе легкую дымку и туман, как на изображении выше. Что ж, еще один запрос, чтобы на картинке была хорошая погода и отличная видимость: «маленькое озеро, холмистый лес, на заднем плане горы, голубое небо, облака».
Ну вот, погода хорошая, тумана нет, а фокус только на траве на переднем плане.
Что делать, чтобы Кандинский сгенерировал четкое изображение?
Предположим, я не хочу добавлять какой-либо объект на передний план - дерево, камни, цветы или что-то там еще. Тем более, что при этом задний план останется размытым. Я хочу получить именно пейзаж с удаленными объектами.
1. Переформулировать запрос
Попробую следующий запрос: «холмистый лес, маленькое озеро, горы на заднем плане, осень, голубое небо, облака». Самое главное - я обозначила задний план. Сезон роли не играет - так, для разнообразия.
Изображение намного четче, но этого недостаточно. Попробую добавить передний план. Запрос для следующей картинки: «лес на переднем плане, маленькое озеро, горы на заднем плане, конец августа, голубое небо, облака».
Ну, почти. Хотелось бы, конечно, еще четче.
2. Добавить в запрос уточняющие промпты
В приложении Шедеврум есть меню с промптами, которые можно добавить в свой запрос: высокое разрешение, высокая детализация, профессиональное фото, 4k. Попробую добавить эти промпты и в Кандинском.
Запрос следующий: «хвойный лес на переднем плане, маленькое озеро, горы на заднем плане, осень, голубое небо, облака, высокая детализация, 8k, высокое разрешение, профессиональное фото». На этот раз, без стиля, поскольку разрешение я уже указала.
В Шедевруме многие вместо 4k указывают 8k, 16k и т.д. Я тоже попыталась и указала в промпте «8k». Я не знаю, могут ли Шедеврум и Кандинский генерировать изображения, в которых пикселей в 8, 16 или 128 раз больше или промпта «4k» достаточно. Объем скачанных файлов с картинками, где в запросе указано «8k» приблизительно такой же, как в случае с «4k».
3. Добавить на передний план объект
И все же, на передний план можно добавить какой-либо объект, на который будет фокусироваться воображаемая камера.
Промпты от Шедеврума я, пожалуй, оставлю. С ними лучше. Запрос: «озеро, на переднем плане камни торчат из воды, заднем плане лес и горы, лето, голубое небо, облака, высокая детализация, 8k, профессиональное фото».
4. Изменить стиль
Предположим, все предыдущие варианты меня не устраивают. Условие - должны отсутствовать как объект на переднем плане, так и размытость. В этом случае можно попробовать сменить стиль изображения. В конце концов, картинка от нейросети не обязана имитировать фотографию.
Основа запроса: «озеро, на заднем плане лес и горы, лето, голубое небо, облака, высокая детализация». Меняю только сезон и стиль.