02 机器学习任务攻略-学习笔记-李宏毅深度学习2021年度

企业开发 2022-05-14 01:44:17 阅读次数: 0

上篇 01 机器(深度)学习介绍-学习笔记-李宏毅深度学习2021年度

下篇 03 梯度（Gradient）很小怎么办（Local Minima与Saddle Point）-学习笔记-李宏毅深度学习2021年度

本节内容及相关链接

模型训练的一些指导意见

课程笔记

训练数据集，符号表示： $\left\{\left(x^{1}, \hat{y}^{1}\right),\left(x^{2}, \hat{y}^{2}\right), \ldots,\left(x^{N}, \hat{y}^{N}\right)\right\}$

测试数据集，符号表示： $\left\{x^{N+1}, x^{N+2}, \ldots, x^{N+M}\right\}$

train 不起来的排查思路：

在这里插入图片描述
各文字的含义：

loss on traing data: 检查train data的loss
loss on traing data -> large：train data的loss比较大
model bias：模型欠拟合了，即不够复杂
optimization：考虑优化optimization
loss on traing data -> small：train data的loss比较小
loss on testing data：检查testing data的loss
loss on testing data -> large：testing data的loss比较大
overfitting：发生了overfitting
mismatch：发生了mismatch
loss on testing data -> small: testing data的loss比较小，模型训练没问题

总结：

模型在train data上的loss很大，说明模型发生了 model bias，解决方案为：

增加模型复杂度
优化Optimization，请参考下篇

模型在train data上的loss小，但在testing data的loss大，说明模型发生了overfitting 或 mismatch。

overfitting含义：模型过度拟合了train data，即过度遵循了train data的规律，导致泛化能力变差

overfitting解决方案为：

收集更多数据
进行数据增强
简化模型（减少模型参数，使用共享参数，减少features数量，early stopping提前终止，Regularization正则化，Dropout 等）

mismatch的含义：train data的分布与testing data 不一致。例如：train data都是黑白图片，testing data却都是彩色图片

交叉验证：将traing set 多次分组，分为训练集和验证集，最终取平均loss最好的那个模型

交叉验证实用场景：在train data 和 validation data上表现都不错，但在testing data（可以理解为真实环境）上表现较差
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/zhaohongfei_358/article/details/123134544

02 机器学习任务攻略-学习笔记-李宏毅深度学习2021年度

李宏毅机器学习笔记-02 Regression

01 机器(深度)学习介绍-学习笔记-李宏毅深度学习2021年度

【李宏毅2021机器学习深度学习】2-1 机器学习任务攻略

04 自动调整学习率（Learning Rate）-学习笔记-李宏毅深度学习2021年度

机器学习笔记（李宏毅 2021/2022）——第二节：机器学习攻略任务

03 梯度（Gradient）很小怎么办（Local Minima与Saddle Point）-学习笔记-李宏毅深度学习2021年度

机器学习笔记02

【李宏毅2021机器学习深度学习】作业讲解

【李宏毅2021机器学习深度学习】Transform

2-1 李宏毅2021春季机器学习教程-第二节机器学习任务攻略

李宏毅老师2021深度学习课程笔记

李宏毅《机器学习深度学习》简要笔记（一）

2021李宏毅机器学习课程笔记——Auto Encoder

学习02

2021-02-02

李宏毅机器学习-学习笔记

【02】机器学习绪论

机器学习前沿02

机器学习入门02

机器学习 - Python 02

机器学习02

机器学习02——KNN

前端学习 02 —— CSS 02

【ML】李宏毅机器学习笔记

李宏毅机器学习笔记

李宏毅机器学习笔记(5)

李宏毅机器学习笔记（4）

李宏毅机器学习笔记（3）

李宏毅机器学习笔记（2）

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)