版权声明:转载请注明出处 https://blog.csdn.net/weixin_40937100/article/details/88878111
郑哲东 Deep-ReID——Learn pedestrian representations from
一、Multi-task Learning 多任务学习
(1)可以做 Identification 和 Vertification
(2)可以做 Triplet
(3)利用一些 Attribute 特征来辅助我们识别
(4)均是从“语义监督”的层面来鉴别
1.Vertification Loss + Identification Loss
(1)前者解决是否similiar的问题,后者解决who is he 的问题,将两种Loss同时分析
(2)两篇文献
2.Triplet Loss
(1)三个样本同时分析
(2)结果相对比较好
3.Attribute Learning
(1)用一些辅助人物,起到正则网络,令最后的Feature Map更具有语义信息。
二、Part Matching——Syntax 语法分析
(1)视觉领域的语法分析:3D建模、图形学
(2)论述包括:1\2\3\4几种方法
1.Horizontal Split
(1)图像分三部分,分别过三个CNN,最后将特征加到一起,作为最后的特征。
(2)这个方法比较早期
(3)水平切
2.Neighbor Comparison
3.Part Detect + Matching
4.Pedestrian Alignment
5.Detection + ReID
6.Attention Matching
三、Data argumentation
(1)每个人的平均照片并不多,所以有可能发生过拟合问题。
(2)利用更多数据,去实现更多变化,提高鲁棒性。
(3)生成更多的样本