LOF
一个点p,和邻域内几个点o
o的密度(平均值)/p的密度
周围点的密度比p大,那p肯定异常
如果用knn,找出距离最近的k个点,化为一类。高密度区容易把不是异常值的也化成异常值,全局采用一个阈值,不能处理不同的密度区域。
但是lof算法是局部的几个点的密度的比值
LOF
一个点p,和邻域内几个点o
o的密度(平均值)/p的密度
周围点的密度比p大,那p肯定异常
如果用knn,找出距离最近的k个点,化为一类。高密度区容易把不是异常值的也化成异常值,全局采用一个阈值,不能处理不同的密度区域。
但是lof算法是局部的几个点的密度的比值