В данной работе сделаем акцент на анализе данных для выявления данных с целью предотвращения киберугроз. Простые статистические методы, такие как среднее, медиана, квантили, могут быть использованы для обнаружения одномерных аномальных значений признаков в наборе данных. Для обнаружения аномалий можно также использовать различные методы визуализации данных и исследовательского анализа данных.
В проанализированных работах, на основе анализа данных были выявлены осноные алгоритмы, позволяющие увидеть аномалию.
Например, алгоритм обнаружения ансамблиевых аномалий, изолированный лес (или iForest, Isolation Forest) - это алгоритм обнаружения аномалий без наблюдения, который использует алгоритм так называемого случайного леса (деревьев решений) для обнаружения выбросов в наборе данных. Алгоритм пытается разделить точки данных таким образом, чтобы каждое наблюдение было изолировано от других.
Обычно аномалии лежат в стороне от кластера точек данных, поэтому их легче изолировать по сравнению