1、滤波
线性滤波是图像处理最基本的方法,它可以允许我们对图像进行处理,产生很多不同的效果。
卷积的原理与滤波类似。但是卷积却有着细小的差别。卷积操作也是卷积核与图像对应位置的乘积和。但是卷积操作在做乘积前,需要先将卷积核翻转180度,之后再做乘积。
2、卷积
2.1、过滤器/卷积核/Kernel
对于滤波器,有一定的规则要求:
1)滤波器的大小应该是奇数,这样它才有一个中心,有中心就也有了半径的称呼,例如5*5大小的核的半径就是2。
2)滤波器矩阵所有的元素之和应该要等于1,这是为了保证滤波前后图像的亮度不变。但是这不是硬性要求。
3)如果滤波器矩阵所有元素之和大于1,那么滤波后的图像就会比原图像更亮,反之,如果小于1,那么得到的图像就会变暗。如果和为0,图像不会变黑,但也会非常暗。
4)对于滤波后的结构,可能会出现负数或者大于255的数值。对这种情况,我们将他们直接截断到0和255之间即可。对于负数,也可以取绝对值。
在具体应用中,往往有多个卷积核,可以认为每个卷积核代表了一种图像模式,例如设计了6个卷积核,可以理解为这个图像上有6中底层纹理模式,也就是我们用6种基础模式就能描绘出一幅图像。
卷积核的作用:提取图像的边缘,提取图像局部特征。
以下为几种常见的卷积应用:
- 平滑均值滤波:
- 高斯滤波:
- 图像锐化:
- Soble边缘检测:
2.2、3通道卷积:
每个通道的卷积核不一样,所以卷积核也变成三通道的卷积核,最后卷积的结果就是把三个通道的卷积结果加在一起,多通道图像也可以用多个卷积核进行卷积,卷积核的个数决定了输出通道的个数,而卷积核的通道数取决于图像的通道数。例如下图中,Filter W0和Filter W1就是两个卷积核,所以可以看到输出通道有两个,而每一个卷积核又有三个通道,这是因为原图像是三通道的。
CNN厉害的地方就在于卷积核不是人为定义的,而是通过大量图片自己训练学习出来的。