标题
Unsupervised Anomaly Detection Based on Minimum Spanning Tree Approximated Distance Measures and Its Application to Hydropower Turbines(官方源地址)(原文地址)
期刊
IEEE Transactions on Automation Science and Engineering(2区)
文章的思路
方法
- 使用高维数据(222维,p11左栏第1段)构造图数据结构
- 使用LoMST方法进行分析(详见算法1 Algorithm 1)
- 用决策树(decision tree)对聚类结果进行分析,相当于把非监督问题转化成了监督问题,使得结果具有一定的可解释性(p12右栏第1、2段)
目标
提出的方法可以有效地识别异常,可以辅助工作人员寻找异常
理解论文的关键点
- p5右栏倒数第2段:解释了为什么归一化处理之前还要进行特殊处理,对应于Algorithm 1 stage 2的第8步
- p6左栏倒数第1段:解释了如何基于观察来选择k
关键细节
- 222 attribute variables(p11左栏第1段)使用了222个点,使用的点很多,但是没说具体是哪些点,也没分析为什么用这些点
- 10-min intervals(p11左栏第1段)10分钟的采样间隔
值得学习的参考文献
2018-Outlier detection for hydropower generation plant(是本文的雏形,暂时不用看)
值得学习的施引文献
- 2019-会议–O-LoMST: An Online Anomaly Detection Approach And Its Application In A Hydropower Generation Plant
- 2019-3区-Hydroelectric Generating Unit Fault Diagnosis Using 1-D Convolutional Neural Network and Gated Recurrent Unit in Small Hydro(常年3区,但是有提升到2区的趋势)
- 2020-3区-Anomaly detection for condition monitoring data using auxiliary feature vector and density-based clustering(稳稳的3区,有时间再看)
值得引用的地方
unsupervised detection methods tend to have a lower detection capability and higher false alarm rate, as compared to general supervised learning algorithms. As a result, unsupervised detection methods are typically used as a screening tool, flagging potential anomalies to be further analyzed by either a human operator or some more expensive procedure.(p6左栏第1段)
完美的托词。非监督检测的检测能力不强,所以一般起辅助作用。
值得学习的地方
为了便于审稿人/读者理解,算法最好列表明示,另外流程图也是很棒的表达方式。
存在的问题
。。。