一、文章贡献：

1、提出了一种新的reid网络Similarity Learning Module (SLM)

2、SLM组件Image Slicing Attention Block (ISA)

3、提出一种新的检测框和gt框匹配的方法Similarity Matching Cascade (SMC)

二、框架

SMILEtrack采用TBD（先检测后匹配）范式。首先通过检测头得到检测框，然后通过运动近似度和外貌相似度进行数据关联。

三、Similarity Learning Module (SLM) for Re-ID

为了提取更加有区别度的外貌特征，作者提出SLM用于Re-ID。首先通过共享权重的ISA得到Attentined feature，然后再通过fully connected layer得到外貌特征，最后算两者间的相似度。

1、ISA

扫描二维码关注公众号，回复： 14778837 查看本文章

不同于标准的transformer的一维输入，为了减少2维图片的计算量，ISA首先将图片按照左上、右上、左下、右下分成四张小图片A、B、C、D，然后通过卷积层得到Image slicing。分别给四个切片添加一维的位置embedding $Ep$ =1，2，3，4，得到切片序列:S={Sa~Sd}。通过Q-K-V attention块，进行如下计算：