数据挖掘的工具
lIBM Intelligent Miner
lSPSS Clementine(modeler)
lSAS Enterprise Miner
lOracle Darwin
lWeka、Knime
lMatlab、Python
lR语言、SparkR
lHadoop mahout、Spark MLlib
决策树
ß决策树学习是归纳推理算法。它是一种逼近离散函数的方法,且对噪声数据有很好的健壮性。
ß知识被表示为决策树,决策树也能再被表示为多个if-then的规则,以提高可读性。
ß基本决策树算法就是一个贪心法。它采用自上而下、分而制之的递归方式来构造一个决策树,在每个节点选取能最好地分类样例的属性。
ß常用实现算法:CART、ID3、ASSISTANT、C4.5