Abstract
文章认为部分类别之间由于视觉特征相似、网络feature map分辨率过小或者由于数据不均衡等原因,会使模型对这些类别感到confused。为了区分这些confusing classes,文章从网络结构设计(Discriminative Confusing Groups)和loss(Improved Cross-Entropy Loss)设计两方面做出了改进。
Discriminative Confusing Groups
其实这里可以看成是共享encoder的模型融合,将容易混淆的类别单独做loss之后进行Fusion,例如下图是cityscape的分组
分类的依据是不同类别之间的混淆矩阵:
Improved Cross-Entropy Loss
将cross entropy loss进行了类似于reweight的改进
改进前:
改进后:
实验
使用不同loss及网络结构的实验结果(cityscape)
结果还是挺不错的
这里在推荐几个关于softmax 不错的文章: