【学习笔记】西瓜书机器学习之第二章模型评估与选择及统计假设检验基础 - 代码天地

【学习笔记】西瓜书机器学习之第二章模型评估与选择及统计假设检验基础

企业开发 2023-09-18 21:42:40 阅读次数: 0

1.评估方法

为了对学习器的泛化误差进行评估，需要采用一个测试集（不在训练集里）来测试模型的能力。这时我们会将数据集D进行适当的处理，从D中获取训练集S和测试集T。不仅如此，有时在D中还需要有一个验证集（Validation）用于比较不同模型的结果。

1.1 留出法(Hold-Out)

直接讲数据集分为两个互斥的集合。比如把数据集按照37分，7分作为训练集，3分作为测试集。一般会采用若干次随机划分，重复进行实验评估后取平均值作为留出法的结果。需要注意的是划分比例，因为：

S 太多 -----T 太少 ------评估结果可能不够准确
S 太少 -----T 太多 ------离真实的模型差距太大

1.2 交叉验证法(Cross-validation)

将数据集D划分成K个大小相同互斥的子集。每次用K-1个子集作为训练集，剩下一个作为测试集。这样就可以获得K组训练集和测试集，从而可进行k次训练和测试，最后返回的也是k组测试的结果的均值。

如果一共m个样本，k=m，在这个特殊情况下得到的交叉验证法称之为留一法(Leave-One-Out)，留一法的优势是实际评估的模型与期望评估的模型很相似。缺点是计算开销太大。

1.3 自助法(bootstrapping)

上述两种方法都有一个弊端，那就是训练集都小于实际的数据集D，而我们想要的是D训练出来的模型。因此自助法很好的解决了这个问题，在m个样本的数据集D中，每次随机

猜你喜欢

转载自blog.csdn.net/weixin_52589734/article/details/112372864

【学习笔记】西瓜书机器学习之第二章模型评估与选择及统计假设检验基础

[DataAnalysis]基于统计假设检验的机器学习模型性能评估——泛化误差率的统计检验

周志华西瓜书《机器学习笔记》学习笔记第二章《模型的评估与选择》

《机器学习》周志华(西瓜书)学习笔记第二章模型评估与选择

机器学习（西瓜书）笔记第二章模型评估与选择

【机器学习】第二章-模型评估与选择-西瓜书笔记

周志华《机器学习》西瓜书课后习题解答——第二章模型评估与选择

机器学习西瓜书——第二章模型评估与选择

周志华《机器学习》第二章模型评估与选择——比较检验

【西瓜书笔记】——第二章：模型评估与选择

统计假设检验

周志华《机器学习》西瓜书小白Python学习笔记（一） ———— 第一章绪论 & 第二章模型评估与选择

模型评估与选择机器学习第二章

【机器学习】周志华读书笔记第二章模型评估与选择

读书笔记-《机器学习》第二章：模型评估与选择

读书笔记机器学习（周志华）第二章模型评估与选择

周志华《机器学习》第二章模型评估与选择笔记及习题解答

机器学习复习笔记2 （第二章模型选择与评估）

统计学习之假设检验

【数理统计学习】统计假设检验

周志华《机器学习》第二章模型评估与选择——模型评估方法

西瓜书机器学习笔记之线性模型

西瓜书第二章--模型评估与选择

ZiSeoi 的西瓜书笔记（二）：第二章模型评估与选择

西瓜书阅读笔记笔记：第二章模型评估与选择

小白学习机器学习---第二章:模型评估与选择（+ROC分析）

机器学习与数据挖掘-作业二-第二章模型评估与选择

《统计推断第二版》笔记——假设检验

《百面机器学习》第二章模型评估

机器学习(周志华) 参考答案第二章模型评估与选择

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)