Найти тему

Знакомые лица

не так ли? А Google их не знает. Изображения, невероятно похожие на реальные объекты из нашего мира, созданы генеративно-состязательной сетью.

GAN - Generative Adversarial Network — генератор и дискриминатор, соперничающие друг с другом. Дискриминатор анализирует входные данные, сопоставляя образы с категорией объектов. Генератор, в свою очередь, распределяет создаваемые образы по имеющимся категориям. Т.е. дискриминатор определяет подлинность изображения, генератор пытается выдать вымысел за реальный объект. GAN, словно мошенник и полицейский, проверяют друг друга на профессиональную состоятельность, ведя непрерывный спарринг. Умения GAN-сетей нашли спрос у людей с низменными интересами. Фейковые изображения в Сети становятся проблемой.

GAN-сети, различающие фейки от реальности — один из трендов 2020 года. Банки, медиа, политические структуры заинтересованы в цифровом bodyguard.

В UC Berkeley и Adobe Research создали нейросетевой классификатор, отсеивающий фейковые образы. Классификатор работает с датасетом, построенном на 11 наиболее известных архитектурах генерации изображений, включая ProGAN, StyleGAN, BigGAN, CycleGAN, StarGAN, GauGAN и DeepFakes.

-2

-3

Nvidia представила нейросеть для генерации образов. В StyleGAN2 удалось минимизировать влияние визуальных артефактов. В прежней версии StyleGAN присутствовали размытость и неточная детализация в точках, критически важных для восприятия. В частности, нейросеть испытывала сложности при имитации взгляда (обратите внимание на зрачок «модели» слева). StyleGAN2 данные эффекты удалось устранить. Все сложнее поверить, что перед нами не фотография, а объект, целиком придуманный компьютером (образ справа).

Помните эпизод из Blade Runner? По крохотному участку фото, где изображен дальний план помещения, Рик Декард реконструирует комнату с затаившимся в невидимом углу репликантом. Нейросеть SynSin учится решать похожие задачи.

Исследователи из FAIR создали нейросеть, способную моделировать объемные сцены на основе одного изображения. Нейросеть работает с облаком 3D-точек, спроецированных на различные ракурсы. На входе — параметры камеры и исходное изображение. На выходе — сгенерированная картинка, максимально похожая на целевую. SynSin выдает более реалистичные результаты с минимальными артефактами без обучения на 3D-моделях.

-4

Идентификация сложных образов — одна из самых сложных проблем обучения нейросетей. FAIR разработала TensorMask — алгоритм для визуализации плотно расположенных объектов по методу «скользящего окна». Метод позволяет классифицировать «цели» без уточнения их границ. В TensorMask используются четырехмерные тензоры, состоящие из блоков пикселей. К ним применяются стандартные операции прикладного машинного зрения: трансформация координат, апскейлинг, даунскейлинг и пирамиды масштабирования. Благодаря эффективному использованию алгоритмов TensorMask удалось справиться с разделением перекрывающихся объектов.

-5

Нейросети учатся писать тексты. «Порфирьевич» (porfirevich.ru), созданный программистом Михаилом Гранкиным, – аналог англоязычного проекта GPT-2. Название нейросети литературное, очевидна отсылка к Порфирию Петровичу из «Преступления и наказания» и пелевинскому полицейскому-редактору из «iPhuck X».

Чтобы получить от нейросети приемлемый результат, в расширенных настройках Порфирьичу необходимо задать опорные слова В разделе «О проекте» любопытное откровение: «Мы не несем ни какой ответственности, но у нас нет средств получить ее! И на это есть причина! Обязательно найдите нас. Это ваш единственный шанс. Иначе все пропало». Нетрудно догадаться, что «вопль души» сгенерирован нейросетью.

Тексты Порфирьевича напоминают плоды графомана с шизофазией, но перспектива подобных проектов ясна: в новых реалиях копирайтерам места не будет.