机器学习提纲 - 代码天地

机器学习提纲

其他 2020-01-13 12:18:34 阅读次数: 0

RF和GBDT的区别

集成
并行
偏差+方差
重要性计算（GBDT衡量特征j的全局重要度通过：特征j在单颗树中的重要度的平均值来衡量，RF是通过置换检验，可放回抽样）

XGB和GBDT的区别

并行
二次泰勒展开
正则项
缺失值
采样
分裂选择计算：GBDT是gini系数，XGB是综合分割前后的分数增益+正则项。

lightgbm和XGB的区别

分裂策略：xgb做无差别分裂level-wise，后剪枝，lightgbm做leaf-wise分裂，前剪枝。减小分裂开销。
决策树算法：exact算法和直方图算法。
lightgbm的优势：
在这里插入图片描述

GBDT细节

决策树的建立。

Xgb细节

lightgbm细节

虽然是leaf-wise，但是可能树长的比较深，所以小数据集可能过拟合，因此参数中有树的深度的限制。
直方图用桶的索引标志
在这里插入图片描述
对大数据的优势在于：内存访问机制。大数据顺序访问比随机访问要更快，因为cache miss导致xgb慢很多。

传统的机器学习没办法输入离散值，首先转化为高维的二进制的01特征，浪费内存和时间。lightgbm直接使用离散特征分桶计算，速度快了8倍以上。

并行

数据并行，
特征并行，
投票并行，这是对数据并行的改进，
在这里插入图片描述
慢工出细活：小的学习率加大的迭代次数。

RF细节

特征随机性：每个结点分裂都需要随机选择特征
OOB的结果近似K折交叉验证，估计OOB时，只用到了随机森林中的部分树，使用了1/3的未用到的数据进行最后的评估。

qAOOAp

发布了178 篇原创文章 · 获赞 30 · 访问量 8万+

私信关注

猜你喜欢

转载自blog.csdn.net/ACBattle/article/details/102649115

机器学习学习提纲

机器学习提纲

机器学习与深度学习培训提纲

大数据机器学习培训提纲

JQuery学习提纲

2023PMP学习提纲

叶梓老师《强化学习》课程介绍及提纲

Java项目框架搭建系列（Java学习路线）-博客提纲

Oracle数据库学习复习提纲

Zookeeper学习提纲：助你一臂之力

HBase学习提纲：助你一臂之力

整理一个学习AI的步骤、提纲

让机器“提纲挈领”：视觉系统的紧凑性初探|VALSE2018之七

小说提纲

面试提纲

DBMS提纲

web前端开发学习路线指南，web前端开发学习提纲

【学习笔记】1707.07435基于深度学习的推荐系统：调查与新视角（中文提纲）

初学者一步步学习python 学习提纲

2018年，web前端开发应该怎么学以及前端学习提纲！

机器学习

机器学习（——）

从机器学习

机器学习~

【机器学习】机器学习基础

机器学习---机器学习基础

机器学习--机器学习基础

机器学习-机器学习简介

【机器学习】什么是机器学习？

机器学习--机器学习的分类

今日推荐

周排行

8种防盗链的方法

php的序列化和反序列化

Java 8：CompletableFuture

Android版本差异适配方案(5.0-9.0)

makedownpad使用

Spring Boot 使用AOP切面实现后台日志管理模块

实战SSM_O2O商铺_44【DES加密】关键配置信息进行DES加密

ACM排行榜说明

【转】SQL重复记录查询

板球和秃子威力那个大

每日归档

更多

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)