Найти в Дзене
10 подписчиков

Как сломать нейросеть, не меняя ничего видимого


Нейросеть видит на картинке панду. Уверенность — 57%.

Добавляем шум, невидимый человеческому глазу. Буквально — матрицу чисел, которую вы не отличите от оригинала.

Та же нейросеть. Та же картинка. Теперь она видит гиббона. Уверенность — 99.3%.

Это называется adversarial examples — состязательные примеры. Микроскопическое изменение входных данных, которое ломает модель. Человек разницы не видит. Машина — видит совершенно другое.

Нейросети не «видят» как мы. Они считают вероятности. И эти вероятности можно сломать, не меняя ничего видимого.

Когда вам говорят «AI точнее человека» — вспомните панду, которая стала гиббоном. С уверенностью 99%.

⚡️ ИИ мания t.me/...nia
Как сломать нейросеть, не меняя ничего видимого  Нейросеть видит на картинке панду. Уверенность — 57%.  Добавляем шум, невидимый человеческому глазу.
Около минуты