科普知识
ICCV 的全称是 IEEE International Conference on Computer Vision,即国际计算机视觉大会,由IEEE主办,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议,被澳大利亚ICT学术会议排名和中国计算机学会等机构评为最高级别学术会议,在业内具有极高的评价。不同于在美国每年召开一次的CVPR和只在欧洲召开的ECCV,ICCV在世界范围内每两年召开一次。ICCV论文录用率非常低,是三大会议中公认级别最高的。ICCV会议时间通常在四到五天,相关领域的专家将会展示最新的研究成果。2019年ICCV将在韩国首尔举办。
# 前言
SEP.
理论篇上一期文章中我们初探了深度学习之深,也就是深层的网络的意思,通常认为VGG网络是第一个探究深度的网络。今天,我们将会与大家一同继续学习与深度学习深度有关的网络--GoogLeNet, 一看名字就是到是谷歌提出来的,但是名字为啥不是:GoogleNet呢?文章的解释是为了像早期的LeNet网络致敬,这也是我们之前学习过的网络,大家还记得吗?
GoogLeNet
今天分享文章标题是:Going deeper with convolutions, 标题翻译过来的意思就是:迈向更深的卷积或者说用卷积迈向更深。其实这个网络不光有深度,还有一点宽度的概念在里面。
论文截图:
论文地址:https://arxiv.org/pdf/1409.4842.pdf
1.网络结构
全部的结构图;
网络参数配置
其中一个小块(核心部分):改模块命名为:Inception ,包含两个版本,通常用右边这个,家里有矿的也可以用左边这个。
我们用右边这个来进行分析结构:
网络结构:
假设输入维度: 28x28x256 (Previous)
从下往上第一行:两个1x1卷积操作,一个3x3最大池化
从下往上第二行:一个3x3卷积操作,一个5x5卷积操作,一个1x1卷积操作
最左边,1x1卷积操作。
从下往上第三层:滤波器拼接层
第一行卷积层1:输入维度:28x28x256, 卷积维度为:1x1x64,输出维度:28x28x64,padding 操作。
第一行卷积层2:输入维度:28x28x256, 卷积维度为:1x1x64,输出维度:28x28x64,padding 操作。
第一行最大池化层:输入维度:28x28x256, 池化维度为:3x3,输出维度:28x28x256,padding 操作。
第二行卷积层1:输入维度:28x28x64, 卷积维度为:3x3x192,输出维度:28x28x192,padding 操作。
第二行卷积层2:输入维度:28x28x64, 卷积维度为:5x5x96,输出维度:28x28x96,padding 操作。
第二行卷积层3:输入维度:28x28x64, 卷积维度为:1x1x64,输出维度:28x28x64,padding 操作。
左边1x1卷积层:输入维度:28x28x256, 卷积维度为:1x1x128,输出维度:28x28x128,padding 操作。
滤波器拼接层:输入(从左往右):28x28x128,28x28x192,28x28x96,28x28x64
输出:28x28x(128+192+96+64)--->28x28x480
以上就是GoogLeNet网络中其中一个核心模块的网络分解,该模块采用不同的卷积核尺寸,从宽度的角度出发构建了一个较深的卷积神经网络。
END
结语
GoogLeNet网络就分享到这里了,可以看到我们只分享了最核心的部分,因为这个网络实在太长了,需要进一步学习的同学们可以通过模块化的方式进行添加哦,下次我们将继续走进GoogLeNet的TensorFlow实战篇。此外,我们学习每一个网络之后,应该考虑这个网络的提出具体有那些贡献,不仅仅是提出一个新的网络哦,而应该看中的是这个网络解决了什么样的难题,这些在原始论文中都是讲的非常清楚的哦,希望大家都能花时间学习学习。
编辑:玥怡居士|审核:小圈圈居士
IT进阶之旅
往期回顾
深度学习理论篇之 ( 十四) -- AlexNet之更上一楼
深度学习理论篇之 ( 十三) -- LetNet-5之风起云涌
过去的一年,我们都做了啥:
点个"赞"再走吧~