递归构造决策树

递归构造决策树:

准备函数:计算熵,用于选择最好的划分特征

递归结束条件为1.决策树节点中只有一种结果,或2.决策树节点的所有属性都已经递归过

递归流程:

1.将训练数据作为决策树的根节点

2.对于节点数据集,计算所有未用特征熵

3.选择最大的熵的特征作为划分数据的关键特征

4.形成分支,每个特征值作为决策树的新节点(新的数据集合,标记已使用和未使用的特征值)

5.新节点没有未使用特征,或所有数据都属于一个结果,则结束递归;反之继续到第二步

   

猜你喜欢

转载自blackproof.iteye.com/blog/2059819