1.什么是数据挖掘
从数据中"淘金",从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程,这就是数据挖掘;它是利用各种分析工具在大量数据中寻找其规律和发现模型与数据之间关系的过程,是统计学、数据库技术和人工智技术的综合。、
2.数据挖掘的基本任务
数据挖掘的基本任务包括利用分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐等方法,帮助企业提取数据中蕴含的商业价值,提高企业的竞争力。
3.数据挖掘建模过程
a.定义挖掘目标:任务理解,指标确定
b.数据取样:建模抽样,质量把控,实时采集
c.数据整理:数据探索,数据清晰,数据变换
d.构建模型:模型发现,构建模型,验证模型
e.模型评价:设定评价标准,多模型对比,模型优化
f.模型发布: 模型部署,模型重构