Найти тему

Искуственный интеллект не умеет делать очаровательные фотографии кошек, явно упуская из виду весь Интернет

Искусственный интеллект (ИИ) недавно попытался создать фотографии кошек с нуля, и результаты оказались катастрофическими.

Эта конкретная нейронная сеть (тип ИИ, смоделированный по образцу работы человеческого мозга) может создавать удивительно реалистичные оригинальные фотографии человеческих лиц. На самом деле, изображения этих выдуманных людей было почти невозможно отличить зрителям от фотографий реальных людей, сообщили программисты ИИ в исследовании, опубликованном в декабре 2018 года в журнале препринтов arXiv.

Смотри как могу!
Смотри как могу!

Кошачьи, однако, оказались совсем другой историей. Тот же алгоритм, который генерировал безупречные человеческие лица, создавал кошек с деформированными головами; неправильное количество глаз и ножек; и тела, которые были слишком длинными, слишком короткими, необычно круглыми или прямоугольными и изогнутыми под необычными углами. [5 интересных применений искусственного интеллекта (это не роботы-убийцы)]

Механизм искусственного интеллекта, который создавал жуткие фотографии кошек, известен как «архитектура генератора на основе стиля для генеративных состязательных сетей» или StyleGAN. Такие сети являются «враждебными», потому что две модели работают одновременно: одна генерирует изображения, а другая сравнивает результаты с фотографиями в наборе обучающих данных, чтобы сеть училась на своих ошибках и улучшала свою производительность, говорится в исследовании.

Чтобы ИИ мог создавать реалистичные человеческие изображения, ему сначала нужно было «узнать», как выглядят человеческие лица по существующим фотографиям. Алгоритм разбил лица на контрольный список стилевых особенностей, таких как положение головы; Пол; цвет кожи; текстура и стиль волос; и форма глаз, носа и рта, сообщили исследователи.

Как только StyleGAN смог распознать все эти элементы - без участия человека - он научился собирать их независимо, чтобы создать совершенно новое фотореалистичное человеческое лицо. Исследователи отклонили запрос на интервью, но объяснили свой процесс в видео, опубликованном на Youtube 12 декабря 2018 года.

Так почему же StyleGAN не смог создать восхитительно реалистичные фотографии кошек? По словам Джанель Шейн, исследователя, обучающего нейронные сети, но не участвовавшего в работе над нейронными сетями, алгоритм старался изо всех сил работать с кошками, и когда дело касалось кошек, тысячи использованных эталонных изображений были далеко не идеальными. исследования, рассказала Live Science.

Шейн написала о странных кошках 7 февраля в своем блоге AI Weirdness. В отличие от набора данных StyleGAN о человеческих лицах, в котором тела и фон были обрезаны, а положение головы было похоже друг на друга, изображения кошек в наборе данных сильно различались. Коллекция включает в себя крупные планы и общие снимки кошек в различных условиях и на разных фонах. На некоторых фотографиях была изображена одна кошка, на некоторых - несколько кошек, а на других тоже были люди.

«Есть перевернутые кошки; есть кошки, свернувшиеся в клубок; их глаза открыты; их глаза закрыты. Вы определенно можете сказать, что их входные данные немного шумные - и под шумным я имею в виду, что там есть что-то это не просто изображение кошки, - сказал Шейн.

Так что не будьте слишком строги к StyleGan из-за его ужасающего зверинца кошмарных кошек.

«Алгоритм еще многое предстоит изучить», - добавил Шейн

В то время как фотореалистичные люди StyleGAN были безупречными, нейронная сеть боролась со сборкой кошачьих.

В то время как фотореалистичные люди StyleGAN были безупречными, нейронная сеть боролась со сборкой кошачьих. (Изображение предоставлено Nvidia)

Конфликтующие визуальные подсказки мешали StyleGAN узнавать, как должна выглядеть настоящая кошка. А у нейронных сетей нет реального контекста для информации, которую им дают; все, что они знают, это то, что находится в их наборах данных. StyleGAN узнал достаточно из эталонных фотографий, чтобы точно воспроизводить мелкие детали и текстуры, такие как кошачий мех или форма кошачьего уха. Но программа явно изо всех сил пыталась собрать всю кошку воедино, сказал Шейн.

«Нейронная сеть не понимает, как работают кошки. Она не понимает, сколько у них ног. Непонятно, сколько у них глаз и куда идет вся их анатомия», - сказала она Live Science.

Смотрите больше тревожных фотографий кошек StyleGAN, почти идеальных человеческих изображений и других файлов проектов на платформе разработки GitHub.