决策树、GBDT、XGBoost和LightGBM之XGBoost

其他 2018-05-30 01:10:06 阅读次数: 5

Github主页：https://linxid.github.io/
知乎：https://zhuanlan.zhihu.com/p/35775368
CSDN：https://blog.csdn.net/linxid/article/details/79973258

XGBoost在GBDT的基础上进行了改进，效果得到了明显的提升。一大不同是显式的引入了正则化项，用来约束决策树的复杂度。

1. 引理

1.1 目标函数

我们求解任何一个监督学习问题，都需要目标函数。

目标函数由两部分构成，损失函数和正则项。

损失函数:
用来衡量模型的拟合情况，构建更好的预测模型。

正则项: 代表树的复杂度，对于未知数据预测时，使得模型具有更小的方差，使得预测更加的稳定,同时避免过拟合。

常见的损失函数和正则项：

过拟合: 两张图即可简单说明
* 第一张：过拟合
* 第二张：拟合效果好
*

1.2 泰勒公式

泰勒公式，是我们众多优化算法推导的基础，将复杂函数优化问题，转变成多项式函数问题。

一阶泰勒公式:

二阶泰勒公式:

2. XGBoost模型原理：

2.1 树集成：

前面已经介绍了，集成学习，也就是多棵树的集成，针对XGBoost详细介绍，集成的原理。前面的介绍的集成树，多是使用的普通决策树。GBDT引入回归树(CART)(classification and regression trees)。在XGBoost中不仅使用CART同时包括分类线性回归。
我们同样从，原作者的例子开始。

一颗CART树：

同样是对是否有人喜欢电脑游戏进行分类：

我们把一个家庭的成员分成不同的叶子，并把他们分配到相应的叶子节点上。 CART 与 decision trees（决策树）有些许的不同，就是叶子只包含决策值。在 CART 中，每个叶子都有一个 real score(真实的分数).

多颗树：

使用多棵树预测，能显著提高我们的准确率，前面已经提到过。

一个样本的最终得分就是每棵树的预测分数加起来。我们暂且不管，为什么会有那个分数，我曾经纠结良久，一直往下看即可。

接下来可能会比较枯燥，大家准备好瓜子。

2.2 数学推导：

2.2.1 损失函数推导：

1.首先给出树集成模型的数学表达式，前面已经提到过，也就是加法模型：

2.然后利用我们刚才已经降到过的目标函数，建立该模型的目标函数：

3.模型公式转换：这部分比较难啃，先看推导式子

其实就是，第ｔ颗树的第ｉ个样本的推导公式，不断从前面建立递推公式。

4.修改目标函数：根据上式对目标函数进行具体化，并使用MSE(均方误差)作为误差函数

5.对误差函数进行二阶泰勒公式展开：对(4)的第一个式子,而不是第二个

6.最终优化的目标函数：

通过公式我们看出，目标函数变成了一个，依赖于gi和hi的函数，当然经过求偏导才可以求出。所以XGBoost支持自定义损失函数。

我们成功推导出，损失函数，然后是正则化，也就是模型复杂度的推导，以及如何求最优解。

2.2.2 求目标函数最优解：

1.首先改进一棵树的定义：

w: 是树叶上的分数向量，也就是我们开始人物头像下面的那个分数；
q: 是将每个数据点分配给叶子的函数;
T: 树叶的数量

2.XGBoost的复杂度定义：

为什么使用这个复杂度，答，前人的经验。

3.修改目标函数的树定义和复杂度：将（1）和（2）带入我们前面得到的公式

4.模型简化：对sigma求和进行调整，便于化简，主要看懂求和范围的转化

是分配给第 j 个叶子的数据点的索引的集合，也就是本来是n个样本，我们将其拆开成T个含有(Ij个)样本的集合。

最后将小sigma求和，用一个变量表示：

5.模型最优解：终于看到曙光了，我们发现其实上式是关于Wj的二次函数，利用求根公式即可求出

鉴于公式复杂，给出一副简单图，说明每个变量到底是任何计算的。

而这一节第一幅图中的样本的分数，从上图就可以明白了。

到此就就结束了？？So Naive

我们推导了，如何建立模型，以及如何求解最优预测分数和最小损失。但是我们并没有给出如何生成一棵树，或者说特征的选择，确定树的结构。决策树讲到了如何使用信息增益来生成一棵树。CART使用Gini系数，C4.5使用信息增益比，XGBoost使用什么。

2.2.3 学习树的结构：

我们尝试将一片叶子分成两片，那如何判断是否要进行划分，我们使用下面的公式：

公式可以分解为，(1)新左叶上的得分; (2)新右叶上的得分; (3)原始叶子上的得分;(4) additional leaf（附加叶子）上的正则化。判断标准：如果增益小于正则化(gama)，我们最好不要添加那个分支。

参考资料：

1.GBDT

https://blog.csdn.net/u012684933/article/details/51088609
https://www.zhihu.com/question/41354392
https://www.zybuluo.com/yxd/note/611571

2.XGBoost

官方文档：http://xgboost.readthedocs.io/en/latest/

中文文档：http://xgboost.apachecn.org/cn/latest/
https://blog.csdn.net/a819825294/article/details/51206410
https://www.analyticsvidhya.com/blog/2016/03/complete-guide-parameter-tuning-xgboost-with-codes-python/

https://blog.csdn.net/sb19931201/article/details/52557382
https://blog.csdn.net/github_38414650/article/details/76061893
http://xgboost.apachecn.org/cn/latest/model.html#id4

猜你喜欢

转载自blog.csdn.net/linxid/article/details/80147179

决策树、GBDT、XGBoost和LightGBM之XGBoost

决策树、GBDT、XGBoost和LightGBM之GBDT

决策树、GBDT、XGBoost和LightGBM之决策树

决策树-RF-GBDT-XGboost-LightGBM

梯度提升决策树（GBDT）与XGBoost、LightGBM

机器学习-决策树（XGBoost、LightGBM）

决策树与集成学习的结合——GBDT和XGBoost

从决策树到GBDT & Xgboost（二）

从决策树到GBDT & Xgboost（一）

xgboost和GBDT对比；xgboost和lightGbm

决策树与XGBOOST

通过５折交叉验证，实现逻辑回归，决策树，SVM,随机森林，GBDT,Xgboost,lightGBM的评分

【机器学习】５折交叉验证的评分-模型逻辑回归，决策树，SVM,随机森林，GBDT,Xgboost，lightGBM

决策树、Bagging、随机森林、Boosting、AdaBoost、GBDT、XGBoost

机器学习 GBDT+xgboost 决策树提升

决策树、CART、GBDT、Xgboost学习笔记

决策树模型，XGBoost，LightGBM和CatBoost模型可视化

决策树（十二）--XGBoost

决策树(下)-Xgboost

RF,GBDT,XGBOOST, LightGBM的对比和分析

GBDT、XGBoost、LightGBM的区别和联系

通俗理解GBDT和XGBoost (从决策树Decision Tree开始，Step-by-Step手把手)

lightgbm,xgboost,gbdt剖析（转）

Linux 安装 gbdt xgboost lightgbm

RF,GBDT,XGBoost,lightGBM的对比

RF、GBDT、XGBoost、LightGBM比较

Boosting算法（GBDT，XGBoost，LightGBM）

lightgbm,xgboost,gbdt的区别与联系

GBDT、XGBOOST、LightGBM调参数

AdaBoost、GBDT、RF、XGboost、lightGBM

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

更多

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)