10 подписчиков

Как сломать нейросеть, не меняя ничего видимого

Нейросеть видит на картинке панду. Уверенность — 57%.

Добавляем шум, невидимый человеческому глазу. Буквально — матрицу чисел, которую вы не отличите от оригинала.

Та же нейросеть. Та же картинка. Теперь она видит гиббона. Уверенность — 99.3%.

Это называется adversarial examples — состязательные примеры. Микроскопическое изменение входных данных, которое ломает модель. Человек разницы не видит. Машина — видит совершенно другое.

Нейросети не «видят» как мы. Они считают вероятности. И эти вероятности можно сломать, не меняя ничего видимого.

Когда вам говорят «AI точнее человека» — вспомните панду, которая стала гиббоном. С уверенностью 99%.

⚡️ ИИ мания t.me/...nia

Как сломать нейросеть, не меняя ничего видимого Нейросеть видит на картинке панду. Уверенность — 57%. Добавляем шум, невидимый человеческому глазу.

Около минуты

18 марта