机器学习笔记之十九——决策树的损失函数（补充） - 代码天地

机器学习笔记之十九——决策树的损失函数（补充）

其他 2020-04-24 00:08:01 阅读次数: 0

决策树生长的核心在于如何选择最优特征作为当前结点分割的特征。

当决策树如此生长完成后，对训练集程度会很好，但是对测试集一般都会出现高方差、过拟合的现象，如何预防这种现象，就是之前提到的预剪枝、后剪枝方法。

而剪枝过程换个方法来讲，其实就是在优化降低Loss function的的过程。

Loss function

设决策树T的叶节点个数为 $|T|$ , $t$ 是树 $T$ 的叶节点，该叶节点有 $N_t$ 个样本点，其中 k 类的样本点有 $N_{tk}$ 个， $k=1,2,\cdot \cdot \cdot ,K$ ,

$H_t(T)$ 为该叶节点的信息熵， $\alpha \geq 0$ 为参数，则决策树学习的损失函数可以定义为：

$C_a(T)=\sum ^{|T|}_{t=1}N_tH_t(T)+\alpha |T|$ -----------李航，《统计学习方法》

公式翻译过来，就是每个叶子节点的样本点数量 * 该结点的信息熵，再加上一个正则项。

优化之……

落在地上的乐乐

发布了88 篇原创文章 · 获赞 28 · 访问量 3万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_35946969/article/details/86934746

机器学习笔记之十九——决策树的损失函数（补充）

机器学习之笔记-决策树

机器学习——决策树补充

机器学习之决策树学习笔记

机器学习笔记之决策树的特征选择

机器学习实战笔记之决策树

机器学习决策树学习笔记

机器学习笔记：决策树

机器学习实战笔记：决策树

机器学习笔记4 －－决策树

机器学习实战笔记（决策树）

机器学习笔记二------决策树

机器学习笔记——决策树

机器学习基础笔记--决策树

机器学习笔记（三）决策树

机器学习笔记（三）：决策树

机器学习笔记（六）决策树

机器学习算法笔记--------决策树

机器学习笔记(三)--决策树

机器学习笔记5：决策树

机器学习笔记（五）---- 决策树

机器学习笔记（八）——决策树

机器学习笔记03——决策树

机器学习---决策树笔记

机器学习决策树笔记

机器学习之决策树

机器学习之决策树算法

机器学习之决策树总结

机器学习系列之决策树

机器学习之决策树

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)