深度网络pre-train对于深度网络的意义 - 代码天地

深度网络pre-train对于深度网络的意义

其他 2019-03-02 09:41:22 阅读次数: 0

1 pre-train 带来更好的优化还是更好的泛化？

pre-train是一个寻网络权值初值的过程，将pre-train的结果作为BP算法的权值的初值，能够解决深度网络在非凸目标函数上陷入局部最优的问题。从这个角度理解更象是带来更好的优化能力。在带有pre-train的深度网络的泛化表现上不仅仅是训练误差很小，同时泛化误差也很小，下图可以看出带有pre-train的网络在减小测试误差的能力上更优秀，感觉是pre-train的网络能够找到一个泛化能力好但是训练误差不一定好的初值，从这里更象是一个正则化的方法。

2 pre-train 在什么情况是有效的？

试验结果说明，浅层简单的网络并不需要pre-train，也好理解，如果浅层网络能够解决的问题，正则化反而会损害模型的表达能力。而在表达能力太强的深层网络，需要pre-train来约束网络的表能力。

---------------------
作者：cjw_seeker
来源：CSDN
原文：https://blog.csdn.net/github_36129812/article/details/53116491
版权声明：本文为博主原创文章，转载请附上博文链接！

猜你喜欢

转载自blog.csdn.net/a8039974/article/details/85013664

深度网络pre-train对于深度网络的意义

深度学习：pytorch用预训练pre-train模型微调参数

（转载）pytorch中的pre-train模型

源码解读之Pre-train

【Pre-train】SpeechT5

putorch的pre-train函数模型或者旧的模型的引用及修改（增减网络层，修改某层参数等） finetune微调

Pytorch的pre-train函数模型或者旧的模型的引用及修改（增减网络层，修改某层参数等） finetune微调 Pytorch的pre-train函数模型或者旧的模型的引用及修改（增减网络层，修改某层参数等） finetune微调

InsightFace源码以及pre-train模型以及使用

Bert系列（三）——源码解读之Pre-train

pytorch中的pre-train函数模型引用及修改

Simple and Scalable Strategies to Continually Pre-train Large Language Models

神经网络与深度学习---train_loss和val_loss(test_lost)分析

【深度学习】网络训练时train/val loss出现周期性剧增原因

深度网络搭建

深度网络压缩

深度学习分类网络

深度残差网络

深度理解网络协议

深度网络中的Tricks

DBN(深度置信网络）

深度信念网络（DBN）

深度神经网络

深度学习网络

深度学习-孪生网络

经典深度分类网络

深度网络设计思路

MTCNN网络深度解析

深度学习-AlexNet网络

深度学习-RepVGG网络

深度网络CTR建模

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)