深度学习完全攻略!(连载十九:卷积神经网络中常用奇淫巧计总结)

CNN中越来越多的应用到各种技巧,以便于提升质量,这一节主要记录那些各种小技巧。

目录

1. ROI pooling

2. ROI align


1. ROI pooling

举个例子:(借用部分网上的图片)

假设经过一系列的卷积和池化后得到的特征图为:

假设有个候选区域在特征图中的位置坐标为(0,3)-(6,7),左上为(1,1),也就是大小为7*5的区域。

如果我们想让每个区域都生成2*2的特征,那么7/2=3,5/2=2,得到

Pooling之后得到

2. ROI align

可以参考这篇文献:https://tjmachinelearning.com/lectures/1718/instance/instance.pdf

举个例子,还是上面的图,只是在划分的时候,保留小数位。

如果还是要得到2*2的输出,那么再把右边分割的部分在做一次分割,

可以看到图中有很多红色的叉叉,这些叉叉就是带求的值,用双线性插值求得之后,每4个红叉做一次max pool, 得到最后的2*2的输出。

那么在插值红色的叉叉的时候,如何选择插值点呢?如果当然是选择在大的黑框里面,离红色的叉叉最近的四个点做插值,因为离的越近,说明相关性越大。

 

 

 

持续更新中。。。。。。。。。。。

欢迎订阅它,关注更多内容。

发布了77 篇原创文章 · 获赞 150 · 访问量 23万+

猜你喜欢

转载自blog.csdn.net/Aoulun/article/details/99491223