16,8 тыс подписчиков

ИИ не сломать: в НИЯУ МИФИ создали нейросеть, устойчивую к «отравлению» данных

21 апреля21 апр

2 мин

Исследователи Национального исследовательского ядерного университета МИФИ разработали новую архитектуру нейросети под названием MambaShield, которая устойчива к так называемым атакам «отравления» данных (data poisoning). Такие атаки — одна из главных угроз для современных систем машинного обучения. Например, когда злоумышленник постепенно внедряет в обучающие данные искажённые примеры, и модель начинает обучаться неправильно. В результате точность может резко упасть — с 95% до 40%. Это особенно опасно для кибербезопасности, беспилотного транспорта, финансов и промышленности. MambaShield умеет отсеивать вредоносные данные ещё на этапе обучения и не даёт им повлиять на результат. Даже если до 30% обучающей выборки окажется заражённой, точность системы остаётся выше 97%. При этом она работает в 4,2 раза быстрее, чем классические трансформеры. Архитектура основана на селективных моделях в пространстве состояний. Проще говоря, система сама решает, какие данные оставить, а какие отбросить, ф

Оглавление

Чем опасно «отравление» данных для ИИ
Как устроена нейросеть от МИФИ
Потенциал для промышленного внедрения

Чем опасно «отравление» данных для ИИ

Такие атаки — одна из главных угроз для современных систем машинного обучения. Например, когда злоумышленник постепенно внедряет в обучающие данные искажённые примеры, и модель начинает обучаться неправильно.

В результате точность может резко упасть — с 95% до 40%. Это особенно опасно для кибербезопасности, беспилотного транспорта, финансов и промышленности.

Как устроена нейросеть от МИФИ

MambaShield умеет отсеивать вредоносные данные ещё на этапе обучения и не даёт им повлиять на результат. Даже если до 30% обучающей выборки окажется заражённой, точность системы остаётся выше 97%. При этом она работает в 4,2 раза быстрее, чем классические трансформеры.

Архитектура основана на селективных моделях в пространстве состояний. Проще говоря, система сама решает, какие данные оставить, а какие отбросить, фильтруя вредоносные примеры.

В основе MambaShield — сразу три технологии. Прогрессивная дистилляция устойчивости (PARD) позволяет передавать знания от нескольких моделей к одной компактной. Иерархическое обучение с подкреплением (HRL) помогает системе адаптироваться к меняющемуся поведению атакующего в реальном времени. А PAC-Bayesian сертификация даёт математические гарантии устойчивости — даже при значительном «отравлении» данных.

Эксперименты на наборах данных о кибератаках (CIC-IoT-2023, CSE-CICIDS2018, UNSW-NB15) показали: точность обнаружения достигает 99,1%, тогда как у аналогов — около 97%. При атаке она падает всего на 2–3%, в то время как у обычных моделей — на 18–20%.

Есть и ограничения. При работе с очень длинными последовательностями (более 5000 шагов) могут накапливаться ошибки округления. А если вредоносных данных становится слишком много (более 50–70%), любая система начинает давать сбои.

Потенциал для промышленного внедрения

MambaShield уже рассматривается как основа для создания доверенного ИИ. Такие решения можно применять на атомных станциях, в финансовой сфере и медицине, где особенно важны точность и устойчивость.

Разработка опубликована в журнале Expert Systems with Applications и получила грант Минэкономразвития России.

Читайте ещё материалы по теме:

Гаджеты и электроника

5,73 млн интересуются