决策树是一种常见的机器学习算法,它的思想十分朴素,类似于我们平时利用选择做决策的过程。它是类似流程图的结构,其中每个内部节点表示一个测试功能,即类似做出决策的过程(动作),每个叶节点都表示一个类标签,即在计算所有特征之后做出的决定(结果)。标签和分支表示导致这些类标签的功能的连接。从根到叶的路径表示分类规则,完全通过生成决策规则来解决分类和回归问题。
(因最近工作忙,具体内容后续逐步编写)
一、数学原理
1、信息熵(information entropy)
2、条件熵(conditional entropy)
3、信息增益(information gain)
4、信息增益率(information gain ratio)
5、基尼指数(Gini index)
二、实现过程
1、三步骤:
特征选择、决策树生成、决策树剪枝
三、分类
1、ID3
2、C4.5
3、CART
参考文章:
https://mp.weixin.qq.com/s/k_OjObExgsi4DaHMSGUUMA
https://mp.weixin.qq.com/s/yFxysYAx2Fe–11kJ4M3tg
https://mp.weixin.qq.com/s/lP5ZqfhDCd4Tt3IYpQm-Lg
https://mp.weixin.qq.com/s/poI_7bBnoxgIciaIQYB_Iw
https://mp.weixin.qq.com/s/YzNH1DybIlBTcJsacAEQwA
https://mp.weixin.qq.com/s/XAJnl9HggdQ6-Rab9GJiVw