版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
一、数据挖掘建模过程
1、数据取样 2、数据探索 3、模式发现 4、数据建模 5、模型评估(误差分析)
二、数据挖掘的基本任务
1、分类与预测
有目标的对事物进行分类预测,如:文本分类、手写体识别等。
2、关联规则
关联模式挖掘旨在从大量的数据当中发现特征之间或数据之间的相互依赖关系。这种存在于给定数据集中的频繁出现的关 联模式,又称为关联规则。
3、时间序列
基于事物发展的延续性和随机性预测事物未来的发展,如:销售量预测、天气预测等。
4、聚类分析
聚类分析是根据数据本身结构特征对数据点进行分类的方法。实质是按照彼此距离的远近将数据分为若干个类别,以使得 类别内数据的“差异性”尽可能小(即“同质性”尽可能大),类别间“差异性”尽可能大。