⚖️ Кибербезопасность против дисбаланса: какие ML-модели реально работают? Многие задачи в кибербезопасности — это бинарная классификация: - вредоносно / не вредоносно, - взлом / норма, - фрод / честная транзакция. Но беда в том, что “вредные” события — редкость, и модели, обученные на таких дисбалансных данных, часто просто «игнорируют» меньшинство. В результате — false negatives, и злоумышленники остаются незамеченными. Исследователи провели масштабное тестирование ML моделей, чтобы изучить данную проблематику. 🧪 Что протестировали? Авторы взяли два больших датасета: Credit Card Fraud (европейская e-commerce): 283726 транзакций, 0.2% — мошенничество (598:1) PaySim (симуляция мобильных платежей): 6.3 млн транзакций, 0.13% — фрод (773:1) И провели 3 эксперимента: ⚙️ Эксперимент 1: какие алгоритмы работают лучше? Тестировали 6 моделей: ➖ Random Forests (RF) ➖ XGBoost (XGB) ➖ LightGBM (LGBM) ➖ Logistic Regression (LR) ➖ Decision Tree (DT) ➖ Gradient Boosting (GBDT) 📈 Ре
⚖️ Кибербезопасность против дисбаланса: какие ML-модели реально работают
13 мая 202513 мая 2025
1 мин