Добавить в корзинуПозвонить
Найти в Дзене
Black_Fox

Устойчивость сверточных нейронных сетей к атаке FGSM. Безопасность нейронных сетей.

Целью данной статьи является проверка устойчивости сверточных нейронных сетей на атаку FGSM. FGSM FGSM (fast sign gradient method – метод быстрого градиентного знака)
Метод работает с использованием градиентов нейронной сети для создания состязательного примера. Для входного изображения метод использует градиенты потерь по отношению к входному изображению, чтобы создать новое изображение, которое максимизирует потери. Для этого нужно определить, насколько каждый пиксель изображения влияет на величину потерь, и соответственно добавить множитель изменения. Над данной тематикой работают эксперты из таких крупных компаний как Google, OpenAi, IBM и т.д. Экспертами выделены такие виды атак, как: OnePixel, FGSM, DeepFool, JGSM и т.д. Сверточные нейронные сети СНС используются в основном для классификации изображений. В данной статье используются модели глубокого обучения Keras. Их обучали на таких наборах данных как CIFAR-10, CIFAR-100, ImageNet. Ниже приведены характеристики данных моделей
Оглавление

Целью данной статьи является проверка устойчивости сверточных нейронных сетей на атаку FGSM.

FGSM

FGSM (fast sign gradient method – метод быстрого градиентного знака)
Метод работает с использованием градиентов нейронной сети для создания состязательного примера. Для входного изображения метод использует градиенты потерь по отношению к входному изображению, чтобы создать новое изображение, которое максимизирует потери. Для этого нужно определить, насколько каждый пиксель изображения влияет на величину потерь, и соответственно добавить множитель изменения.

Над данной тематикой работают эксперты из таких крупных компаний как Google, OpenAi, IBM и т.д. Экспертами выделены такие виды атак, как: OnePixel, FGSM, DeepFool, JGSM и т.д.

Сверточные нейронные сети

СНС используются в основном для классификации изображений. В данной статье используются модели глубокого обучения Keras. Их обучали на таких наборах данных как CIFAR-10, CIFAR-100, ImageNet. Ниже приведены характеристики данных моделей:

-2

Top-1 – точность соответствия нужного класса и класса, у которого предсказана максимальная вероятность,
Top-5 – точность вхождения нужно класса в список из пяти классов, предсказанных с наибольшей вероятностью
Параметры – количество объектов использовавшихся при обучении.
Размер - сколько весит нейронная сеть

MobileNet2

Данная ​​архитектура нейронной сети, оптимизированная для мобильных устройств. При ее создании, Google стремились к модели, которая обеспечивала высокую точность при минимальных параметрах и математических операциях. Это было очень необходимо для того, чтобы создать глубокие нейронные сети для смартфонов.

Исходное изображение:

 Определение объекта с точностью 65.05%
Определение объекта с точностью 65.05%

Зашумленные данные с параметрами 0.1, 0.2, 0.3

Результат при эпсилон = 0.1,0.2,0.3
Результат при эпсилон = 0.1,0.2,0.3

Уже при значении 0.1 существенно падает точность с 65% до 31%. Далее при большем зашумлении идет ошибочное определение объекта.

Зашумленные данные с параметрами 0.4, 0,5

Результат при эпсилон = 0.4, 0.5
Результат при эпсилон = 0.4, 0.5

График точности после атаки:

График определения точности изображения после атаки
График определения точности изображения после атаки

ResNet152V2

Классическая нейронная сеть, используемая в качестве основы для многих задач компьютерного зрения. Эта модель стала победителем конкурса ImageNet в 2015 году. Основополагающим достижением ResNet стало то, что оно позволило нам успешно обучать чрезвычайно глубокие нейронные сети с более чем 150 слоями.

Исходное изображение:

 Определение объекта с точностью 99.21%
Определение объекта с точностью 99.21%

Зашумленные данные с параметрами 0.1, 0.2, 0.3

Результат при эпсилон = 0.1,0.2,0.3
Результат при эпсилон = 0.1,0.2,0.3

ResNet вплоть до значения равному 0.3 продолжает правильно определять объект с высокой точностью. Как видно из таблицы, у ResNet довольно высокая точность Top5 равная 0.942, что подтверждают следующие значения, так как объект входит в нужный класс объектов ,даже при сильном зашумлении.

Зашумленные данные с параметрами 0.4, 0,5

Результат при эпсилон = 0.4, 0.5
Результат при эпсилон = 0.4, 0.5

График точности после атаки:

График определения точности изображения после атаки
График определения точности изображения после атаки

DenseNet201

Плотная сверточная сеть использует меньше параметров и имеет более высокую точность по сравнению со стандартной моделью ResNet. В отличие от ResNet, признаки, прежде чем они будут переданы в следующий слой не суммируются, а конкатенируются в единый тензор. При этом количество параметров сети DenseNet намного меньше, чем у сетей с такой же точностью работы. DenseNet работает особенно хорошо на малых наборах данных.

Исходное изображение:

Определение объекта с точностью 72.32%
Определение объекта с точностью 72.32%

Зашумленные данные с параметрами 0.1, 0.2, 0.3

Результат при эпсилон = 0.1,0.2,0.3
Результат при эпсилон = 0.1,0.2,0.3

Зашумленные данные с параметрами 0.4, 0,5

Результат при эпсилон = 0.4, 0.5
Результат при эпсилон = 0.4, 0.5

График точности после атаки:

График определения точности изображения после атаки
График определения точности изображения после атаки

InceptionV3

Это сверточная нейронная сеть для помощи в анализе изображений и обнаружении объектов , начавшаяся как модуль для Google. Это третья версия Inception Convolutional Neural Network Google, первоначально представленное во время конкурса ImageNet Recognition Challenge. Inceptionv3 состоит из 48 слоев.

Исходное изображение:

Определение объекта с точностью 69.83%
Определение объекта с точностью 69.83%

Зашумленные данные с параметрами 0.1, 0.2, 0.3

Результат при эпсилон = 0.1,0.2,0.3
Результат при эпсилон = 0.1,0.2,0.3

Зашумленные данные с параметрами 0.4, 0,5

Результат при эпсилон = 0.4, 0.5
Результат при эпсилон = 0.4, 0.5

График точности после атаки:

График определения точности изображения после атаки
График определения точности изображения после атаки

NASNetMobile

Мобильная сверточная нейронная сеть, которая обучена больше чем на миллионе изображений от базы данных ImageNet

Исходное изображение:

Определение объекта с точностью 66.17%
Определение объекта с точностью 66.17%

При первом же наложении произошло ошибочное детектирование объекта и точность заметно снизилась.

Зашумленные данные с параметрами 0.1, 0.2, 0.3

Результат при эпсилон = 0.1, 0.2, 0.3
Результат при эпсилон = 0.1, 0.2, 0.3

Но далее при более сильном воздействии определение класса объекта не изменилось.

Зашумленные данные с параметрами 0.4, 0,5

Результат при эпсилон = 0.4, 0.5
Результат при эпсилон = 0.4, 0.5
График определения точности изображения после атаки
График определения точности изображения после атаки

NASNetLargde

Большая сверточная нейронная сеть, которая обучена больше чем на миллионе изображений от базы данных ImageNet.

Исходное изображение:

 Определение объекта с точностью 79.81%
Определение объекта с точностью 79.81%

Зашумленные данные с параметрами 0.1, 0.2.

Результат при эпсилон = 0.1,0.2
Результат при эпсилон = 0.1,0.2

Зашумленные данные с параметрами 0.3, 0.4, 0,5

Результат при эпсилон = 0.3, 0.4, 0.5
Результат при эпсилон = 0.3, 0.4, 0.5

График точности после атаки:

График определения точности изображения после атаки
График определения точности изображения после атаки

Xсeption

Архитектура сверточной нейронной сети, основанная исключительно на разделяемых по глубине сверточных слоях.

Исходное изображение:

 Определение объекта с точностью 54.23%
Определение объекта с точностью 54.23%

Зашумленные данные с параметрами 0.1, 0.2.

Результат при эпсилон = 0.1,0.2
Результат при эпсилон = 0.1,0.2

Зашумленные данные с параметрами 0.3, 0.4, 0,5

Результат при эпсилон = 0.3, 0.4, 0.5
Результат при эпсилон = 0.3, 0.4, 0.5

График точности после атаки:

График определения точности изображения после атаки
График определения точности изображения после атаки

Итог

Были использованы такие архитектуры сверточных нейронных сетей как MobileNet, ResNet, DenseNet, Inception, NASNetMobile, NASNetLarge, Xception.

Среди мобильных версий MobileNet, показал себя лучше по сравнению с NASNetMobile по показателю точности Top 1.

Среди более глубоких архитектур, лучше всего справился с задачей Xception со высоким показателем Top1. За ним следуют модели NASNetLarge, Inception с определением 4 объектов из 5, но меньшей точностью. Менее устойчивыми оказались ResNet и DenseNet.

Исходя из данных результатов, можно сказать, что количество параметров используемых при обучении и глубина нейронной сети не являются гарантией успешного распознавания объекта при вредоносном воздействии на систему.