为什么需要交叉验证 - 代码天地

为什么需要交叉验证

其他 2020-02-26 10:36:38 阅读次数: 0

为什么需要cv？

在训练集（train set）上训练得到的模型表现良好，但在测试集（test set）的预测结果不尽如人意，这就说明模型可能出现了过拟合（overfitting），bias低而variance高，在未知数据上的泛化能力差。

一个改进方案是，在训练集的基础上进一步划分出新的训练集和验证集（validate set），在新训练集训练模型，在验证集测试模型，不断调整初始模型（超参数等），使得训练得到的模型在验证集上的表现最好，最后放到测试集上得到这个最优模型的评估结果。

这个方案的问题在于模型的表现依赖于验证集的划分，可能使某些特殊样本被划入验证集，导致模型的表现出现异常（偏好或偏差）。而且训练集划了一部分给验证集后，训练模型能得到的数据就变少了，也会影响训练效果。因为通常来说，训练数据越多，越能反映出数据的真实分布，模型训练的效果就越好，越可能得到无偏估计。

交叉验证思想应运而生，交叉验证可以充分使用所有的训练数据用于评估模型。

CtrlZ1

发布了149 篇原创文章 · 获赞 111 · 访问量 16万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_41076797/article/details/102730862

为什么需要交叉验证

交叉编译，为什么需要交叉编译

为什么要用交叉验证

机器学习：为什么需要验证集？

2.机器学习之为什么要用交叉验证

为什么Web端登录需要验证码？

【验证测试】为什么有了指针还需要引用？

什么是交叉验证(Cross Validation)？

为什么需要MiniDao?

为什么需要WAF

为什么需要堆？

为什么需要缓存

为什么需要RTTI

为什么需要Docker？

为什么需要zk

为什么需要中断?

为什么需要Maven

为什么需要SDN？

为什么需要JMM

为什么需要VLAN

为什么需要 input？

【转】什么是交叉编译，为什么要使用交叉编译

[转]什么是交叉编译,为什么要使用交叉编译?

为什么使用交叉熵呢？

shiro框架---关于多项目之间验证为什么需要共享session

在进行机器学习建模时，为什么需要验证集(validation set)？

人为什么需要耶稣

为什么需要消息系统

为什么需要框架（java）

为什么需要企业架构？

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)