1、数据挖掘建模过程
2、数据取样
数据取样标准:相关性、可靠性、有效性,不一定要动用全部企业数据,通过对样本数据的精选,能减少数据处理量,节省系统资源,更好显现数据的规律性。
衡量取样数据质量的标准:
- 资料完整无缺,各类指标齐全;
- 数据准确无误,反映的都是正常状态下的水平
3、数据探索
异常值分析、缺失值分析、相关分析、周期性分析等
4、数据预处理
数据筛选、数据变量转换、缺失值处理、坏数据处理、数据标准化、主成分分析、属性选择、数据规约等
1、数据挖掘建模过程
2、数据取样
数据取样标准:相关性、可靠性、有效性,不一定要动用全部企业数据,通过对样本数据的精选,能减少数据处理量,节省系统资源,更好显现数据的规律性。
衡量取样数据质量的标准:
3、数据探索
异常值分析、缺失值分析、相关分析、周期性分析等
4、数据预处理
数据筛选、数据变量转换、缺失值处理、坏数据处理、数据标准化、主成分分析、属性选择、数据规约等