Machine Learning Techniques 笔记：2-9 Decision Tree - 代码天地

Machine Learning Techniques 笔记：2-9 Decision Tree

其他 2018-06-04 01:47:30 阅读次数: 0

g(x) 即为最终的选择

容易理解，但缺乏强有力的数学理论保障

1.首先学如何做分支

扫描二维码关注公众号，回复： 1439579 查看本文章

2.根据分支，分成c块，

3. 各分支学习一个各自的小树

4. 各分支整合起来，生成大树。

但只有这4个步骤，可能不行，因为没有停止的条件。

1.每次一刀切两段，只建造二元树

2. 回传一个最好的常数（二元分类，回传最多的y；回归问题，回传y的平均）

1.利用decision stump切分二元树。decision stump：在data中只看一个feature，决定完看那个feature后，就往两边切割，一边为+1，一边为-1。

CART：不断切割，到leaf时返回常数。

2.purifying：切开后，看起来比较纯的左边的dataset与右边的dataset，用最纯的切割方式作为现在的切割方法。

通过Ein 最小，来体现分类的纯度

Ein=0，可能会导致模型过复杂，容易overfit

选择一个Ein不那么大，但不会overfit的树

摘掉一片叶子的树出发，逐步增加叶子，生成不同的树，选择Ein与复杂度加权后最优的树。用validation set选择一个适合的lambada

如果体重信息缺失，可以利用其它feature，如身高做切割，切出类似的效果。一般，身高越高，体重越重

第一刀，左边非常纯净，两边各做一个子树，组成一颗大树

第二刀，对右边的子树切割，同样，左边最纯

第三刀，类似第二刀，将右边的子树的子树切割

同理，继续

切刀都很纯净

回传常数

CART：每次针对不同的决策边界做切割，可以做比较细致的切割。

看起来比Adaboost，一定要切割完全的水平/垂直刀更有效率

CART如果不做pruning，会得到low Ein，但可能会导致overfit，high Eout

猜你喜欢

转载自blog.csdn.net/f2157120/article/details/80515623

Machine Learning Techniques 笔记：2-9 Decision Tree

Machine Learning (ML) Techniques

Machine Learning Techniques 笔记：2-13 Deep Learning

Machine Learning Techniques 笔记：2-5 Kernel Logistics Regression

Machine Learning Techniques 笔记：2-8 Ada Boosting

Machine Learning Techniques 笔记：2-7 Blending and Bagging

Machine Learning Techniques 笔记：2-10 Random Forest

Machine Learning Techniques 笔记：2-6 Support Vector Regression

Machine Learning Techniques 笔记：2-15 Matrix Factorization

Machine Learning Techniques 笔记：2-16 Finale

Machine Learning Techniques 笔记：2-2 Dual Support Vector Machine

Machine Learning Techniques 笔记：2-4 Soft-Margin Support Vector Machine

Machine Learning Techniques 笔记：2-3 Kernel Support Vector Machine

Machine Learning Techniques 笔记：2-1 Linear Support Vector Machine

【Machine Learning】【Python】选择最优参数(Decision Tree, Random Forest, Adaboost, GBDT)

【Machine Learning】【Python】提取直方图特征做图片预分类(Decision Tree, Random Forest, Adaboost)

Machine Learning | (7) Scikit-learn的分类器算法-决策树(Decision Tree）

Machine Learning---9--tree regression

Machine Learning Techniques 笔记：2-14 Radial Basis Function Network

林轩田机器学习技法（Machine Learning Techniques）笔记（六 ~ 十六）

林轩田机器学习技法（Machine Learning Techniques）笔记（五）

林轩田机器学习技法（Machine Learning Techniques）笔记（一）

林轩田机器学习技法（Machine Learning Techniques）笔记（四）

林轩田机器学习技法（Machine Learning Techniques）笔记（三）

林轩田机器学习技法（Machine Learning Techniques）笔记（二）

R Unleash Machine Learning Techniques 免积分下载

Machine Learning（7）Neural network —— optimization techniques I

“Survey of machine learning techniques for malware analysis ” 个人总结

Decision tree classifier学习笔记

decision Tree

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)