Стоковые фотографии — проклятие для многих маркетологов и дизайнеров. Крупные компании, предоставляющие изображения, непомерно дороги. Ну а те, что подешевле могут вызвать беспокойство со стороны отдела кадров.
Мы же плавно преодолеваем эти барьеры путем создания таких нестандартных шедевров как эти потрясающие фотографии Марка Цукерберга:
К сожалению, не все наделены такой виртуозностью. Однако вскоре ИИ придет к нам на помощь, и поможет скрыть художественную бездарность, позволив создавать фотореалистичные изображения.
Новое видео Nvidia GauGAN2 показывает нам потенциал программы. Система может переводить текст в фотореалистичные изображения, которые затем можно редактировать по своему усмотрению.
Модель, созданная на основе генеративных состязательных сетей (GAN), объединяет отображение сегментации, рисование и преобразование текста в изображение. Эти функции можно использовать как для создания чего-то мистического и волшебного, например единорогов и радуги. Ну, или чего-то более реалистичного, например, апокалипсиса.
Демо-версия лучше всего работает с простыми описаниями природы, такими как «закат на песочном пляже» или «снег в горах». Более сложный текст может давать странные результаты, но это дает программе возможность показать свои возможности редактирования изображения. Вы можете создать карту объектов, а затем перейти в режим рисования, чтобы внести любые изменения, а умная кисть GauGAN2 преобразует эскиз в фотографию. Эта функция позволяет, например, добавить на фото дерево, или увеличить гору. Его также можно использовать для создания несуществующих объектов.
«Представьте себе, например, возможность воссоздания ландшафта культовой планеты Татуин во франшизе« Звездных войн », у которой два солнца», - сказал Ишан Салиан из Nvidia в своем блоге. «Нужно всего лишь написать «солнце на песочных холмах», а пользователь сможет самостоятельно дорисовать второе солнце»
Результаты не всегда бывают идеальны, но видео демонстрация ярко показывает огромный потенциал ИИ. Вполне возможно, что скоро мы откажемся от стоковых фотографий в пользу бесконечно настраиваемого генератора изображений.