修改一行代码,简单粗暴涨点!浙大提出FcaNet:频率域通道注意力网络

本文提出一种新的基于DCT频率域的通道注意力,其在分类、检测和分割任务上,性能优于SENet、CBAM和GCNet等主干,代码和模型即将开源!

注:文末附计算机视觉交流群

FcaNet: Frequency Channel Attention Networks
在这里插入图片描述

  • 作者单位:浙江大学(李玺团队)
  • 代码:https://github.com/dcdcvgroup/FcaNet
  • 论文:https://arxiv.org/abs/2012.11879

注意力机制,尤其是通道注意力,在计算机视觉领域取得了巨大的成功。许多工作专注于如何设计有效的通道注意力机制,同时忽略一个基本问题,即使用全局平均池(GAP)作为毫无疑问的预处理方法。

在这项工作中,我们从不同的角度出发,并使用frequency analysis重新考虑通道的注意力。基于频率域分析,我们在数学上证明了传统的GAP是频域中特征分解的特例。有了证明,我们自然地在频域上概括了通道注意力机制的预处理,并提出了具有新颖的multi-spectral通道注意力的FcaNet。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
所提出的方法简单但有效。我们只在计算中更改一行代码,以在现有通道注意力方法中实施我们的方法。
在这里插入图片描述

主要贡献:

在这里插入图片描述

实验结果

与其他在图像分类,目标检测和实例分割任务上的通道注意力方法相比,该方法可实现最新的结果。与基线SENet-50相比,在相同数量的参数和相同的计算成本的情况下,我们的方法在ImageNet上的Top-1准确性方面可提高1.8%。我们的代码和模型将公开提供。

在这里插入图片描述

CVer-计算机视觉交流群

建了CVer微信交流群!细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。

想要进计算机视觉学习交流群的同学,可以直接加微信号:CVer5555。加的时候备注一下:研究方向+学校+昵称,即可。然后就可以拉你进群了。

强烈推荐大家关注CVer知乎账号和CVer微信公众号,可以快速了解到最新优质的CV论文。

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/amusi1994/article/details/111595913#comments_22461034