学习笔记之决策树

决策树是一种常见的机器学习算法,它的思想十分朴素,类似于我们平时利用选择做决策的过程。它是类似流程图的结构,其中每个内部节点表示一个测试功能,即类似做出决策的过程(动作),每个叶节点都表示一个类标签,即在计算所有特征之后做出的决定(结果)。标签和分支表示导致这些类标签的功能的连接。从根到叶的路径表示分类规则,完全通过生成决策规则来解决分类和回归问题。

(因最近工作忙,具体内容后续逐步编写)

一、数学原理

1、信息熵(information entropy)

2、条件熵(conditional entropy)

3、信息增益(information gain)

4、信息增益率(information gain ratio)

5、基尼指数(Gini index)

二、实现过程

1、三步骤:

特征选择、决策树生成、决策树剪枝

三、分类

1、ID3

2、C4.5

3、CART

参考文章:
https://mp.weixin.qq.com/s/k_OjObExgsi4DaHMSGUUMA
https://mp.weixin.qq.com/s/yFxysYAx2Fe–11kJ4M3tg
https://mp.weixin.qq.com/s/lP5ZqfhDCd4Tt3IYpQm-Lg
https://mp.weixin.qq.com/s/poI_7bBnoxgIciaIQYB_Iw
https://mp.weixin.qq.com/s/YzNH1DybIlBTcJsacAEQwA
https://mp.weixin.qq.com/s/XAJnl9HggdQ6-Rab9GJiVw

发布了12 篇原创文章 · 获赞 9 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/sun91019718/article/details/105606163