通过对用电负荷用r软件进行聚类,我们可以提取典型负荷曲线,提高随后的用电量预测的准确性。
我将向您展示第一个用例,即通过K-medoids聚类方法提取典型的电力负载曲线。
我们必须以某种方式降低维度。最好的方法之一是使用时间序列表示来降低维度,减少噪音并强调时间序列的主要特征。
我们使用一种基本的基于模型的表示方法 - 平均季节性轮廓。另一个非常重要的通知是,时间序列的归一化是时间序列的每个聚类或分类之前的必要过程。
使用K-medoids(pam函数从cluster包)聚类方法 。
“最佳”数量的簇是7 。
我们用7个聚类数绘制聚类结果。
现在,让我们尝试一些更复杂的方法来提取季节性分布 - GAM回归系数。
可视化结果:
再次聚类的最佳数量是7.让我们绘制结果。
提取的消费情况比平均季节性情况更平滑。蓝色虚线与每日和每周季节性系数相接。
我将向您展示一些非数据自适应表示的聚类结果,让我们选择例如DFT(离散傅立叶变换)方法并提取前48个DFT系数。
因此,基于模型的时间序列表示在这种用例中非常有效(因此典型的剖面提取)。
FeaClip是从限幅表示特征提取方法。建议将FeaClip旁边的开窗方法用于时间序列的每一天。
我们绘制结果
我们可以看到,现在出现了2个“肘部”。最大的变化是在2到3个簇之间,所以我会选择3号。
结论
在本教程中,我向您展示了使用时间序列表示方法来创建更多消费者的特征。
通过对用电负荷用r软件进行聚类,我们可以提取典型负荷曲线,提高随后的用电量预测的准确性。
我将向您展示第一个用例,即通过K-medoids聚类方法提取典型的电力负载曲线。
我们必须以某种方式降低维度。最好的方法之一是使用时间序列表示来降低维度,减少噪音并强调时间序列的主要特征。
我们使用一种基本的基于模型的表示方法 - 平均季节性轮廓。另一个非常重要的通知是,时间序列的归一化是时间序列的每个聚类或分类之前的必要过程。
使用K-medoids(pam函数从cluster包)聚类方法 。
“最佳”数量的簇是7 。
我们用7个聚类数绘制聚类结果。
现在,让我们尝试一些更复杂的方法来提取季节性分布 - GAM回归系数。
可视化结果:
再次聚类的最佳数量是7.让我们绘制结果。
提取的消费情况比平均季节性情况更平滑。蓝色虚线与每日和每周季节性系数相接。
我将向您展示一些非数据自适应表示的聚类结果,让我们选择例如DFT(离散傅立叶变换)方法并提取前48个DFT系数。
因此,基于模型的时间序列表示在这种用例中非常有效(因此典型的剖面提取)。
FeaClip是从限幅表示特征提取方法。建议将FeaClip旁边的开窗方法用于时间序列的每一天。
我们绘制结果
我们可以看到,现在出现了2个“肘部”。最大的变化是在2到3个簇之间,所以我会选择3号。
结论
在本教程中,我向您展示了使用时间序列表示方法来创建更多消费者的特征。