【深度学习】GoogLeNet系列解读 —— Inception v3 - 代码天地

【深度学习】GoogLeNet系列解读 —— Inception v3

其他 2018-11-16 19:42:41 阅读次数: 0

版权声明：本文为博主原创文章，请尊重原创，转载请注明原文地址和作者信息！ https://blog.csdn.net/zzc15806/article/details/83474661

目录

GoogLeNet系列解读

Inception v3

Inception v3整体上采用了Inception v2的网络结构，并在优化算法、正则化等方面做了改进，总结如下：

1. 优化算法使用RMSProp替代SGD。

2. 使用Label Smoothing Regularization（LSR）方法。LSR是一种通过在输出y中加噪声，实现对模型进行约束，降低模型过拟合的方法。进行模型训练时，通常真是标签q(k/x)采用one-hot的形式，而模型的输出一般为softmax归一后的概率分布p(k/x)，

$p(k/x)=\frac{exp(z_k)}{\sum_i^{i=K}exp(z_i))}$

损失函数为，

$H(q,p)=- \sum_{k=1}^{K}log({p(k)q(k)})$

训练的目的是使p(k/x)的分布尽可能接近q(k/x)，但是这种方法很容易产生过拟合。举个例子，假设分类器需要区分“我们都喜欢玩耍”和“我们都喜欢学习”两句话。假设“玩耍”出现80次，“学习”出现20次，因为标签采用one-hot的形式，随着次数的增加，模型会逐渐倾向于“玩耍”这句话的搭配，使这个搭配的预测概率逐渐趋向于100%，而“学习”这个搭配会逐渐被忽略。

为了解决这个问题，作者以权重加入某一概率分布到原始标签中构成新的标签，形式如下：

$q'(y/x)=(1-\alpha )q(y/x)+\alpha u(y)$

其中， $\alpha \in [0,1]$ 。论文中作者使用了均匀分布，

$q'(y/x)=(1-\alpha )q(y/x)+\frac{\alpha}{K}$

这种方式可以防止把模型预测值过分集中在给率较大的类别上，会对小概率类别增加更多的关注。

此时，损失函数变为，

$H(q',p)=- \sum_{k=1}^{K}log({p(k)q'(k)})=( 1-\alpha )H(q,p)+\alpha H(u,p)$

从损失函数可以看出，LSR相当于使用了两个loss。当u服从均匀分布时，H(u,p)为常数，能够衡量预测分布p和均匀分布的不相似程度，起到了正则化的作用。

3. 将第一个7x7卷积层分解为两个3x3卷积层。

4. 辅助分类器（auxiliary classifier）的全连接层也进行了batch-normalization操作。

Inception v3相比于Inception v2有了较大的提升，实验结果如下：

猜你喜欢

转载自blog.csdn.net/zzc15806/article/details/83474661

【深度学习】GoogLeNet系列解读 —— Inception v3

【深度学习】GoogLeNet系列解读 —— Inception v1

【深度学习】GoogLeNet系列解读 —— Inception v2

【深度学习】GoogLeNet系列解读 —— Inception v4

从GoogLeNet至Inception v3

Paper Reading: Inception系列之Inception v3

白话超级详细解读(一)-----GoogLeNet（Inception V1-Inception V3）

深度学习面试题29：GoogLeNet(Inception V3)

深度学习网络篇——Inception v3

Inception V3

GoogLeNet 改进之 Inception-v2/v3 解读

Inception V3论文解读和代码解析

网络结构解读之inception系列四：Inception V3

Inception结构和Inception V1, V2, V3学习

Rethinking the Inception Architecture for Computer Vision-Inception v2 v3详细解读

含并行连结的网络 GoogLeNet / Inception V3 动手学深度学习v2 pytorch

花种类预测-迁移学习（Inception V3）

GoogLeNet 之 Inception v1 v2 v3 v4

GoogLeNet(inception-v1,v2,v3,v4)阅读笔记

深度解读GoogleNet之Inception V1

详解深度学习之经典网络架构（五）：GoogLeNet 四代(Inception v1、v2、v3、v4)

网络结构解读之inception系列二：GoogLeNet（Inception V1）网络结构解读之inception系列二：GoogLeNet（Inception V1）

【Tensorflow】深度学习实战05——Tensorflow实现Inception V3

Keras深度学习——基于Inception v3实现性别分类

Keras深度学习实战——基于Inception v3实现性别分类

【深度学习】Inception模型结构解析，关键词：Inception-v1、v2、v3、v4、Inception-ResNet-v1、Inception-ResNet-v2

GoogLeNet 之 Inception-v1 解读

深度学习之GoogLeNet (Inception v4 & Inception-ResNet-v2)

Google-Net系列(Inception v1、v2、v3、v4)

【TensorFlow系列】【五】利用inception v3 pb模型文件做预测

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)