1.介绍
本文在c-shape算法基础上提出了两个新颖的时间序列聚类算法。两个算法受FCM启发,FCS+用基于形状的距离函数取代FCM中的内积。FCS++不仅使用基于距离的函数,而且还用形状提取样本取代FCM聚类核心。
时间序列聚类算法的距离衡量方法有很多种,ED和DTW是最常用的方法。ED通常在两个等长序列中才有效。DTW距离基于时间序列的形状信息评估相似性,但是该方法计算复杂,因为每一对时间序列的相似性时间代价和数据长度成二次方关系。
现有基于形状的聚类算法有两个缺陷:(i)计算复杂且不适合大规模数据。(2)方法局限于特定领域,或者有效性只在小数据集上验证过。
k-shape是解决时间序列聚类的方法,该方法选择自相关作为衡量时间序列的相似度方法,且用一个新的核心计算方法。该方法在聚类准确性和有效性都得到验证。
本文提出两个新的算法,首先用k-shape中的SBD替代模糊c-means肃反啊,第二个是采用SBD和形状提取方法更新模糊c-means聚类算法的原型。与k-shape相比较,两个算法在精度和效率上可以取得很大提高。
2.FCS+和FCS++聚类算法
FCS+算法使用SBD替换FCM中的内积。FCS++不仅使用基于距离的函数,而且还用形状提取样本取代FCM聚类核心。