论文笔记之ATSS

1. 摘要

作者发现,采用相同的正负例选择策略时,无论是基于box(anchor-based)的检测器(本文以RetinaNet为例)还是基于关键点的(anchor-free)检测器(以FCOS为例),性能几乎一样,也就是说正负例的定义对于检测器性能是非常重要的,所以本文设计了一种新的自适应训练正负样本选择算法,对于anchor-based和anchor-free的检测器都有很大的提升。

2. 本文方法

2.1 RetinaNet和FCOS两者对比

  • RetinaNet在特征图上每个点铺设多个anchor,而FCOS在特征图上每个点只铺设一个中心点,这是数量上的差异。
  • RetinaNet基于anchor和GT之间的IoU和设定的阈值来确定正负样本,而FCOS通过GT中心点和铺设点之间的距离和尺寸来确定正负样本。这1点可以从下图的对比中看到,牛这张图像中蓝色框和点表示GT,红色框表示RetinaNet铺设的anchor,红色点表示FCOS铺设的点,左右两边类似表格上的数值表示最终确定的正负样本,0表示负样本,1表示正样本。在这里插入图片描述
  • RetinaNet通过回归矩形框的2个角点偏置进行预测框位置和大小的预测,而FCOS是基于中心点预测四条边和中心点的距离进行预测框位置和大小的预测。这1点可以从下图的对比中看到,蓝色框和点表示GT,红色框表示RetinaNet的正样本,红色点表示FCOS的正样本。在这里插入图片描述

2.2 算法流程

在这里插入图片描述
输入:
G:图片的真实框集合
L:特征金字塔层次
A_i:第i层的一系列anchor box
A:所有的anchor box
k:是一个超参数,默认为9

输出:
P:正例的集合
N:负例的集合

过程:

  • 对于每个输出的检测层,选计算每个anchor的中心点和目标的中心点的L2距离,选取K个anchor中心点离目标中心点最近的anchor为候选正样本(candidate positive samples)
  • 计算每个候选正样本和groundtruth之间的IOU,计算这组IOU的均值和方差
  • 根据方差和均值,设置选取正样本的阈值:t=m+g ;m为均值,g为方差
  • 根据每一层的t从其候选正样本中选出真正需要加入训练的正样本(IOU>t)
  • 训练

3. 实验

  • 回归方式的不同并不是造成FCOS和RetinaNet效果差异的原因,如何确定正负样本才是造成FCOS和RetinaNet效果差异的原因。
  • 传统的基于IoU的样本选择策略,每个位置平铺更多的anchor box是有效的。但是,在使用我们提出的方法后(适当选择正样本),在每个位置平铺多少anchor box都是一样的。 在这里插入图片描述
  • 所提出的方法对于不同的anchor box的设置是鲁棒的。在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/haha0825/article/details/106034574