Поскольку единственный способ «объяснить» нейросети, что именно ты хочешь видеть на сгенерированном изображении, это слова, прописанные в промте, то возникает резонный вопрос – а насколько точно эти слова распознаются и интерпретируются. Например, если есть задача создать изображение в определенной цветовой гамме, то задать нужный оттенок тоже придется словами.
Есть, конечно, еще способы повлиять на цвет. Можно выбрать какое-то изображение-основу и дать нейросети скопировать цветовую палитру с него. С этим, кстати, отлично справляется Recraft, где это делается буквально одной кнопкой. Кроме того, в той же Recraft есть опция задать точный цвет по номеру HEX, что очень сильно оценят дизайнеры, работающие с брендбуками и четко прописанными цветами, но чем точно не будут пользоваться все остальные.
В итоге, в большинстве случаев, задать цветовую палитру при генерации изображения необходимо будет именно словами. Для того, чтобы протестировать, насколько хорошо распознает названия цветов нейросеть NightCafe Studio, а точнее модели, которые она использует, я решила взять цвета года по версии Института Цвета Pantone. Оказывается, они уже 25 лет выделяют цвет года, вот как раз, 25 изображений – это отличная выборка. Кроме того, каждому цвету года присвоено определенное название.
Для чистоты эксперимента я прописала один конкретный промт, описывающий акварельный скетч, изображающий модель в стильном пальто. Текст промта (без учета некоторых дополнений, позволяющих немного отшлифовать стиль):
Watercolor fashion scetch style image, plain white background. The cutiest extremely slim girl ever wearing a long beautiful stylish [Color-of-the-Year]-colored coat in a style of a fashion scetch in an abstract fantasy watercolor background
А дальше подставляла нужное название цвета года и смотрела на результат. Теперь покажу, что получилось. В каждой картинке слева изображение девушки в пальто цвета конкретного года, сгенерированное нейросетью NightCafe (использовала модель RealVisXL v4). Справа настоящий цвет года, взятый с сайта Pantone. В подписи к каждому изображению – мое мнение о том, насколько хорошо справилась нейросеть. Давайте смотреть :)
Вывод
В целом, считаю, что создавать изображения с заданным цветом получается очень даже неплохо, за редким исключением. Главное, чтобы все-таки название цвета было более или менее общеупотребимое или универсальное, потому что абстрактные названия цветов, выбранные специально для некоторых цветов года, не воспринимаются как цвета совсем. Кроме того, на примере тех случаев, когда цветов года было два, и хотелось пальто сделать одного цвета, а шляпу другого, стало заметно, что нейросеть плохо разделяет, что каким цветом покрасить. Давно заметила, что гораздо лучше выходят изображения с одним доминирующим цветом, чем, когда пытаешься прописать, что какого цвета должно быть. Например, если пытаешься сгенерировать изображение с несколькими персонажами и прописываешь, кто во что одет, в итоге получаешь примерно одного цвета одежду. Об этом, кстати, есть отдельная статья с конкретными примерами.
Читайте истории, смотрите картинки, тренируйте свое цветовосприятие :)