В этой статье я хочу обобщить свой небольшой опыт использования нейронных сетей для коммерческой иллюстрации.
Стартовые условия
У меня имелся небольшой опыт использования сетей DALL-E 2 и MidJourney, я примерно представлял, что я могу получить с их помощью, поэтому я уже заранее решил, что я воспользуюсь нейронной сетью для получения референса, а не конечного изображения.
Задача: получить реалистичное изображение смеющегося мужчины в образе античного бога. Впоследствии на основе этого референса я собирался отрисовать иллюстрацию для винной этикетки.
Требования: мне нужно было лицо, на котором явно бы читалась эмоция счастья. Это должно было быть убедительное изображение беззаботного смеха.
Должен сказать, что рисую я довольно быстро. Поэтому для меня было критичным время, которое я потрачу на получение изображения от нейронной сети. С этой точки зрения я сразу отказался от MidJourney - в силу элементарного неудобства ее использования через Дискорд и необходимости поиска своих изображений в ленте множества других изображений и необходимости нескольких итераций для получения приемлемого результата.
Запрос и результат
Итак. вот каким был мой запрос:
Portrait of a man in the image of a Greek God wearing a laurel wrath laughing merrily
Я выбрал вот это изображение, поскольку здесь эмоция читалась наиболее явно.
Выводы.
В целом, нейросеть справилась с задачей. Но итоговое изображение не назовешь безупречным. При ближайшем рассмотрении видно, что лица как бы "наскоро слеплены", они не симметричны, мелкие детали заблюрены, изображения акссесуаров типа лаврового венка лишено реалистичности. Однако, если у вас есть навыки рисования, то данный способ создания уникальных референсов людей вполне рабочий и он точно очень быстрый.