【读论文】MUTUAL-CHANNEL LOSS

论文题目：《The Devil is in the Channels: Mutual-Channel Loss for Fine-Grained Image Classification》

链接：https://arxiv.org/abs/2002.04264

来源：IEEE TIP2020

细粒度分类的主要思想是找出各个子类间的可区分特征，因此文章指出要尽早在通道上进行钻研，而不是从合并的特征图区分，并提出了互通道损失（Mutual-Channel Loss）。该损失包含2个部分：判别组件（discriminality component）和多样性组件（diversity component），即2个分支。整个框架结构如下图所示，Conv.layers表示一系列的卷积层，用于特征提取（如VGG16和ResNet等），Feature channels即是最后一个卷积出来的特征图，整个模型被交叉熵和提出的互通道损失约束。

在这里插入图片描述

THE MUTUAL-CHANNEL LOSS (MC-LOSS)

MC-Loss的做法是让每个类别对应一部分特征图，文章中所说的 $\xi$ ，然后每个类别的特征足够可区分，表示每个类别的特征图也要尽量各不相同，因此有了区分性分支和多样性分支。结合下图（b）能够更好理解。

在这里插入图片描述

整个 $L_{mc}$ 的公式为：

在这里插入图片描述

The Discriminality Component

判别组件分支包含4道程序，如图（a）左边：
- CWA，全名是Channel-Wise Attention，但实际上是基于定义的每个类别对应的通道个数进行随机Dropout，具体操作就是按Dropout的概率，生成相应比例的0,1乘上特征图。
- CCMP，Cross-Channel Max Pooling，跨通道的最大池化，依照Maxout的思想，按照每个类别的通道，取出最大值，这样就能够把一个类的所有判别性的特征集中到一个一维特征图上。
- 最后经过GAP和Softmax，使用交叉熵来计算判别组件的损失。
$L_{dis}$ 公式如下：