1. 论文基本信息
- 论文标题:Discriminative Correlation Filter with Channel and Spatial Reliability
- 作者:Alan Lukezic等
- 出处:CVPR,2017
- 文章链接:https://arxiv.org/abs/1611.08461
- 补充材料:https://www.semanticscholar.org/paper/Discriminative-Correlation-Filter-with-Channel-and-Luke%C5%BEi%C4%8D-Voj%C4%B1-%C5%99/7b485979c75b46d8c194868c0e70890f4a0f0ede
- 源码链接:https://github.com/alanlukezic/csr-dcf
这篇笔记主要针对分割操作进行分析和理解,关于论文其他部分创新点及其整体思路会在后续文章中进行分析。
2. 似然和后验概率在论文中的作用
目前基于相关滤波的跟踪算法,主要存在三个方面的问题:
- 当前的相关滤波算法,由于FFT,导致滤波器尺寸与图像块尺寸必须一致,这样就限制了检测范围
- 当前的相关滤波算法,由于引入了循环矩阵,导致滤波器的训练数据并不真实
- 当前的相关滤波算法,只能支持矩形目标,与真实世界不符合
作者为解决上述问题,提出的创新点之一就是“空间置信”(Spatial Reliability),其主要思想是利用图像分割方法产生适应能力更好的蒙版(mask),这个空间置信图就是通过下面后验概率的求解得到的。
3. 具体建模和操作
文章这一部分涉及到的概念有:
- 贝叶斯
- Epanechnikov
- foregroundLikelihood/backgroundLikelihood
- 反向投影
- 后验概率
以求解目标的后验概率为例,根据论文源代码,其公式为
其中,
文章在求解上述先验概率
文章在计算似然时,用到了反向投影方法。直观上理解,就是利用反向投影中的颜色信息,在采样范围内捕捉与目标颜色相近的部分,作为似然(疑似目标),关于反向投影的知识,可以参考:
- http://blog.csdn.net/sevencolorfish/article/details/6840719
- http://docs.opencv.org/2.4/doc/tutorials/imgproc/histograms/back_projection/back_projection.html
根据贝叶斯后验概率公式,在已知先验概率和似然的前提下,可以求出后验概率,因此能够得出最终需要的蒙版的概率图(也就是论文中的spatial reliability map)。
与文章中的公式进行对照,发现吻合,相同的颜色表示同一类物理量,如下:
附上论文的示意图,一并对照
4. 小结
从物理意义上分析,这种思路可以粗略理解为用先验概率图与似然概率图进行的某种图像卷积而形成的滤波过程,最终实现了对不规则形状的物体的自适应,这种创新思路值得我们学习。关于滤波器优化的推导过程(Lagrange方法),见论文笔记2:http://blog.csdn.net/discoverer100/article/details/78323934