NVIDIA Research продемонстрировала новый инструмент на основе искусственного интеллекта, GauGAN, который превращает простые рисунки в фотореалистичные изображения. Инструмент создает изображения практически мгновенно, реалистично настраивая элементы, например добавляя отражение к водоему, когда рядом с ним располагаются деревья или горы.
Новый инструмент использует генеративно-состязательные сети (GAN). Пользователь выбирает элементы, например «горы» или «небо», а затем проводит линии для разделения элементов друг от друга. После этого ИИ автоматически генерирует подходящее изображение для каждого элемента, например, облака, траву или деревья.
Как демонстрирует в своем видеоролике NVIDIA (представлен ниже), GauGAN поддерживает реалистичность изображения, динамически настраивая его части в соответствии с новыми элементами. Например, преобразование травянистого поля в заснеженный пейзаж приведет к автоматическому изменению неба, обеспечивая совместимость и реалистичность обоих элементов.
Сеть GauGAN обучалась на миллионах изображений реальных ландшафтов. В дополнение к созданию фотореалистичных пейзажей, инструмент позволяет добавлять различные фильтры, включая художественные стили или, к примеру, имитацию заката. По словам NVIDIA, технология может использоваться для генерации изображений других типов, включая строения и людей.
Вице-президент NVIDIA по исследованию прикладного применения глубокого обучения Брайан Катанзаро объясняет суть работы GauGAN:
«Эта технология не просто склеивает вместе части изображений или вырезает и вставляет текстуры. По сути, она синтезирует новые изображения, что очень схоже с тем, как художники рисуют что-либо».
NVIDIA предполагает, что инструмент, основанный на GauGAN, однажды сможет использоваться в архитектуре, ландшафтном дизайне и в других профессиональных областях, где нужно быстро заполнять сцену или визуализировать среду. Схожий инструмент может однажды быть использован в программах для редактирования изображений, позволяя пользователям быстро добавлять и настраивать элементы фотографий.