Модель DCdetector для обнаружения аномалий в глубоких нейронных сетях, принятая на конференции KDD 2023, привлекла внимание исследователей, однако ее результаты местами вызывают больше вопросов, чем ответов. Один из исследователей, протестировавший оригинальный код модели, отметила отсутствие логов потерь, что может вызвать сомнения в надежности результатов. После добавления собственного логирования, были выявлены интересные, но подозрительные данные. Например, в ходе обучения показатели потерь оставались на одинаковом уровне без каких-либо значительных изменений. При тестировании модели, скорости обучения колебались на уровне около 0,34 – 0,69 секунд за итерацию. Потери при обучении показывали уровень от 17 до 21,6, что говорит о нестабильности работы модели. За несколько эпох логические значения потерь оставались в диапазоне от 0 до NaN, что намекает на существующие алгоритмические проблемы. Резюме: отсутствие логов потерь на первой итерации, поступление неопределённого значения NaN
Модель DCdetector для обнаружения аномалий имеет проблемные результаты
23 марта23 мар
1 мин