本文提出一种新的基于DCT频率域的通道注意力，其在分类、检测和分割任务上，性能优于SENet、CBAM和GCNet等主干，代码和模型即将开源！

注：文末附计算机视觉交流群

FcaNet: Frequency Channel Attention Networks
在这里插入图片描述

作者单位：浙江大学（李玺团队）
代码：https://github.com/dcdcvgroup/FcaNet
论文：https://arxiv.org/abs/2012.11879

注意力机制，尤其是通道注意力，在计算机视觉领域取得了巨大的成功。许多工作专注于如何设计有效的通道注意力机制，同时忽略一个基本问题，即使用全局平均池（GAP）作为毫无疑问的预处理方法。

在这项工作中，我们从不同的角度出发，并使用frequency analysis重新考虑通道的注意力。基于频率域分析，我们在数学上证明了传统的GAP是频域中特征分解的特例。有了证明，我们自然地在频域上概括了通道注意力机制的预处理，并提出了具有新颖的multi-spectral通道注意力的FcaNet。

在这里插入图片描述

所提出的方法简单但有效。我们只在计算中更改一行代码，以在现有通道注意力方法中实施我们的方法。

主要贡献：

在这里插入图片描述

实验结果

与其他在图像分类，目标检测和实例分割任务上的通道注意力方法相比，该方法可实现最新的结果。与基线SENet-50相比，在相同数量的参数和相同的计算成本的情况下，我们的方法在ImageNet上的Top-1准确性方面可提高1.8％。我们的代码和模型将公开提供。

在这里插入图片描述

CVer-计算机视觉交流群

建了CVer微信交流群！细分方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。

想要进计算机视觉学习交流群的同学，可以直接加微信号：CVer5555。加的时候备注一下：研究方向+学校+昵称，即可。然后就可以拉你进群了。

强烈推荐大家关注CVer知乎账号和CVer微信公众号，可以快速了解到最新优质的CV论文。

在这里插入图片描述

修改一行代码，简单粗暴涨点！浙大提出FcaNet：频率域通道注意力网络

主要贡献：

实验结果

CVer-计算机视觉交流群

猜你喜欢