深度学习理论篇之 ( 十六) -- GoogLeNet之再探深度之谜

科普知识

ICCV 的全称是 IEEE International Conference on Computer Vision，即国际计算机视觉大会，由IEEE主办，与计算机视觉模式识别会议（CVPR）和欧洲计算机视觉会议（ECCV）并称计算机视觉方向的三大顶级会议，被澳大利亚ICT学术会议排名和中国计算机学会等机构评为最高级别学术会议，在业内具有极高的评价。不同于在美国每年召开一次的CVPR和只在欧洲召开的ECCV，ICCV在世界范围内每两年召开一次。ICCV论文录用率非常低，是三大会议中公认级别最高的。ICCV会议时间通常在四到五天，相关领域的专家将会展示最新的研究成果。2019年ICCV将在韩国首尔举办。

# 前言

SEP.

理论篇上一期文章中我们初探了深度学习之深，也就是深层的网络的意思，通常认为VGG网络是第一个探究深度的网络。今天，我们将会与大家一同继续学习与深度学习深度有关的网络--GoogLeNet, 一看名字就是到是谷歌提出来的，但是名字为啥不是：GoogleNet呢？文章的解释是为了像早期的LeNet网络致敬，这也是我们之前学习过的网络，大家还记得吗?

GoogLeNet

今天分享文章标题是：Going deeper with convolutions，标题翻译过来的意思就是：迈向更深的卷积或者说用卷积迈向更深。其实这个网络不光有深度，还有一点宽度的概念在里面。

论文截图：

论文地址：https://arxiv.org/pdf/1409.4842.pdf

1.网络结构

全部的结构图;

网络参数配置

其中一个小块（核心部分）：改模块命名为：Inception ,包含两个版本，通常用右边这个，家里有矿的也可以用左边这个。

我们用右边这个来进行分析结构：

网络结构：

假设输入维度: 28x28x256 (Previous)

从下往上第一行：两个1x1卷积操作，一个3x3最大池化

从下往上第二行：一个3x3卷积操作，一个5x5卷积操作，一个1x1卷积操作

最左边，1x1卷积操作。

从下往上第三层：滤波器拼接层

第一行卷积层1：输入维度：28x28x256，卷积维度为：1x1x64，输出维度：28x28x64，padding 操作。

第一行卷积层2：输入维度：28x28x256，卷积维度为：1x1x64，输出维度：28x28x64，padding 操作。

第一行最大池化层：输入维度：28x28x256，池化维度为：3x3，输出维度：28x28x256，padding 操作。

第二行卷积层1：输入维度：28x28x64，卷积维度为：3x3x192，输出维度：28x28x192，padding 操作。

第二行卷积层2：输入维度：28x28x64，卷积维度为：5x5x96，输出维度：28x28x96，padding 操作。

第二行卷积层3：输入维度：28x28x64，卷积维度为：1x1x64，输出维度：28x28x64，padding 操作。

左边1x1卷积层：输入维度：28x28x256，卷积维度为：1x1x128，输出维度：28x28x128，padding 操作。

滤波器拼接层：输入（从左往右）：28x28x128，28x28x192，28x28x96，28x28x64

输出：28x28x(128+192+96+64)--->28x28x480

以上就是GoogLeNet网络中其中一个核心模块的网络分解，该模块采用不同的卷积核尺寸，从宽度的角度出发构建了一个较深的卷积神经网络。

END

结语

GoogLeNet网络就分享到这里了，可以看到我们只分享了最核心的部分，因为这个网络实在太长了，需要进一步学习的同学们可以通过模块化的方式进行添加哦，下次我们将继续走进GoogLeNet的TensorFlow实战篇。此外，我们学习每一个网络之后，应该考虑这个网络的提出具体有那些贡献，不仅仅是提出一个新的网络哦，而应该看中的是这个网络解决了什么样的难题，这些在原始论文中都是讲的非常清楚的哦，希望大家都能花时间学习学习。

编辑：玥怡居士|审核：小圈圈居士

IT进阶之旅

往期回顾

深度学习理论篇之 ( 十五) -- VGG之初探深度之谜

深度学习理论篇之 ( 十四) -- AlexNet之更上一楼

深度学习理论篇之 ( 十三) -- LetNet-5之风起云涌

过去的一年，我们都做了啥：

【年终总结】辞旧迎新，2020，我们再出发

【年终总结】2021，辞旧迎新再出发

点个"赞"再走吧~

深度学习理论篇之 ( 十六) -- GoogLeNet之再探深度之谜

猜你喜欢