第十一讲--课时24

计算机视觉任务:


semantic segmentation 是对图像中所有像素做分类,只要是一类的都不加区分,如下,两只奶牛都被标记的一样


semantic segmentation方案一  sliding windows

对每个小区域去做分类,且有重叠,计算量太大。



方案二 Fully convolutional

卷积过程中保持尺寸不变,改变深度。最后一层深度为C(类别数目),然后在channel上做argmax即可分类


上图计算量还是大,改进如下


down sampling: pooling ,strided conv

up sampling: unpooling ,transpose conv                               

####upsampling应与downsampling对称,比如downsampling采用maxpooling,upsampling就要对应max位置去做un_maxpooling

unpooling: nearest neighbor,bed of nails


卷积:


反卷积:


卷积操作可以写成矩阵乘法

[x,y,z]是卷积核,去卷积[a,b,c,d]       zero_padding=1    stride=1

可以写作下图左边的矩阵乘法

而反卷积也可以看做矩阵乘法,而且X变为了X.T(transpose),反卷积乘法过程中a不再填充。

stride = 1时,反卷积可以看做卷积,即用[x,y,z]卷积核去卷积[a,b,c,d],zero_padding=2,stride=1


stride = 2时,反卷积不能再看作卷积


猜你喜欢

转载自blog.csdn.net/qq_39638957/article/details/80297181