1. 论文基本信息

论文标题：Discriminative Correlation Filter with Channel and Spatial Reliability
作者：Alan Lukezic等
出处：CVPR，2017
文章链接：https://arxiv.org/abs/1611.08461
补充材料：https://www.semanticscholar.org/paper/Discriminative-Correlation-Filter-with-Channel-and-Luke%C5%BEi%C4%8D-Voj%C4%B1-%C5%99/7b485979c75b46d8c194868c0e70890f4a0f0ede
源码链接：https://github.com/alanlukezic/csr-dcf

这篇笔记主要针对分割操作进行分析和理解，关于论文其他部分创新点及其整体思路会在后续文章中进行分析。

2. 似然和后验概率在论文中的作用

目前基于相关滤波的跟踪算法，主要存在三个方面的问题：

当前的相关滤波算法，由于FFT，导致滤波器尺寸与图像块尺寸必须一致，这样就限制了检测范围
当前的相关滤波算法，由于引入了循环矩阵，导致滤波器的训练数据并不真实
当前的相关滤波算法，只能支持矩形目标，与真实世界不符合

作者为解决上述问题，提出的创新点之一就是“空间置信”（Spatial Reliability），其主要思想是利用图像分割方法产生适应能力更好的蒙版（mask），这个空间置信图就是通过下面后验概率的求解得到的。

3. 具体建模和操作

文章这一部分涉及到的概念有：

贝叶斯
Epanechnikov
foregroundLikelihood/backgroundLikelihood
反向投影
后验概率

以求解目标的后验概率为例，根据论文源代码，其公式为

p r o b_o = p _ o \cdot f o r e g r o u n d l i k e l i h o o d p _ o \cdot f o r e g r o u n d l i k e l i h o o d + p _ b \cdot b a c k g r o u n d l i k e l i h o o d

$prob\_o = \frac{{p\_o \cdot foregroundlikelihood}}{{p\_o \cdot foregroundlikelihood + p\_b \cdot backgroundlikelihood}}$

其中， $p\_o$ 是先验概率，它可以认为是固定的数值，与采样数据中的前景/背景区域有关，而 $foregroundlikelihood$ 相当于似然，可以理解为“在给定的前景图像中，该像素属于目标的概率（疑似目标）”，最后求解的 $prob\_o$ 是后验概率，可以理解为“在给定的目标图像条件下，该像素属于前景蒙版的概率”

文章在求解上述先验概率 $p\_o$ 时，利用Epanechnikov分布进行了处理（论文使用的不是标准Epanechnikov，有修改，本质上仍然属于二次函数）

location prior

文章在计算似然时，用到了反向投影方法。直观上理解，就是利用反向投影中的颜色信息，在采样范围内捕捉与目标颜色相近的部分，作为似然（疑似目标），关于反向投影的知识，可以参考：

根据贝叶斯后验概率公式，在已知先验概率和似然的前提下，可以求出后验概率，因此能够得出最终需要的蒙版的概率图（也就是论文中的spatial reliability map）。

与文章中的公式进行对照，发现吻合，相同的颜色表示同一类物理量，如下：
公式对应

附上论文的示意图，一并对照
这里写图片描述

4. 小结

从物理意义上分析，这种思路可以粗略理解为用先验概率图与似然概率图进行的某种图像卷积而形成的滤波过程，最终实现了对不规则形状的物体的自适应，这种创新思路值得我们学习。关于滤波器优化的推导过程（Lagrange方法），见论文笔记2：http://blog.csdn.net/discoverer100/article/details/78323934

CSR-DCF视频目标跟踪论文笔记（1）——关于似然和后验概率在分割操作中的应用

1. 论文基本信息

2. 似然和后验概率在论文中的作用

3. 具体建模和操作

4. 小结

猜你喜欢