RoIPooling、RoIAlign的简单、直观理解
禁止任何形式的转载!!!
在两阶段的目标检测中RoIPooling、RoIAlign经常被用到,都是在特征图上截取感兴趣的区域,本文打算以最简洁的方式展示两者的区别:
- RoIPooling
或者:
由图可见,在一开始进行crop的时候为了取整,截取到的特征与计算的位置有偏差;接下来进行pooling的时候,同样为了取整,直接舍弃了部分特征信息。
- RoIAlign
如下图,不进行crop,先保留小数进行划分;划分完之后显然都不是完整的小格子(特征图像素),但是接下来要进行pooling,所以就在划分后的大格子里选取n个代表性的点(双线性插值得到);最后把这些代表性的点像之前特征图一样进行pooling即可。
这样做,就可以不偏不倚、不丢失信息的将感兴趣的特征图区域的信息都利用上。
既然是pooling那么就是每个通道分别都是进行这样的操作。
最后再给大家安利一个详细版:一文读懂 RoIPooling、RoIAlign 和 RoIWarp