卷积神经网络用于图像识别(一)

近期参与了学校的关于图像识别项目,但是现在不知道如何下手去做,所以先了解一些基础知识,图像识别用到了卷积神经网络,听起来好高大上哇,到底什么是卷积神经网络?上网查了许多资料,理解上仍有偏差,于是,有个小白下决心一定要好好研究研究。

什么是卷积???

只看数学符号,卷积是抽象的,但是,我们可以通过现实中的意义,来习惯卷积这种运算。

从数学上讲,卷积就是一种运算。我们称 (f*g)(n)f,g 的卷积。

其连续的定义为:

\displaystyle (f*g)(n)=\int _{-\infty }^{\infty }f(\tau )g(n-\tau )d\tau \\

其离散的定义为:

\displaystyle (f*g)(n)=\sum _{\tau =-\infty }^{\infty }{f(\tau )g(n-\tau )}\\

注意到了一点,这两个式子有一个共同特征,就是f(x)与g(y)中的x+y=n,可以这么理解:我们要的到的结果假设为F(n),它是由n来决定的,而n又分为两部分x和y,分别作了两个函数的自变量这两个函数作用得到了我们想要的结果F(n),而这个作用的过程就是卷积。

这个特征有什么意义呢? 

卷积的重要的物理意义是:一个函数(如:单位响应)在另一个函数(如:输入信号)上的加权叠加。

在图像处理过程中用到的是矩阵进行卷积,通俗的理解为:

假设有一个卷积核h,就一般为3*3的矩阵:

有一个待处理矩阵x:

h*x的计算过程分为三步

第一步,将卷积核翻转180°,也就是成为了

第二步,将卷积核h的中心对准x的第一个元素,然后对应元素相乘后相加,没有元素的地方补0。

这样结果Y中的第一个元素值Y11=1*0+2*0+1*0+0*0+0*1+0*2+-1*0+-2*5+-1*6=-16

第三步每个元素都像这样计算出来就可以得到一个输出矩阵,就是卷积结果

参考:

https://www.zhihu.com/question/22298352

https://blog.csdn.net/qq_32846595/article/details/79053277

猜你喜欢

转载自blog.csdn.net/qq_41000782/article/details/81175149