AW-Convlution:An Attention Module for Convolutional Neural Networks - 代码天地

AW-Convlution:An Attention Module for Convolutional Neural Networks

其他 2021-11-26 05:50:28 阅读次数: 0

AW-Convlution

文章目录

- - AW-Convlution

参考

创新点

提出当前注意激活模型的两个问题：
- 特征图的近似问题和容量不足问题
提出AW-convolution结构来缓解这个问题

问题&思想描述

个人认为，这两个问题其实是一个问题，即特征图的近似问题，而容量不足问题更多可以表述为作者为解决自己提出的AW-Convlution结构不能对每个channel做独特的channel而提出的问题（后来应该是变成多个filter解决的）
此前的注意力通常可以分为Channel Attention和Spatial Attention，但这样只能达到逼近自适应校准的效果，而真正要达到自适应校准的话则是需要计算得到和Feature Map同样大的Attention Map然后点积才行，但是这样计算量太大（注意是有FC产生同样大小的map）
- 比如CBAM，这个模型就是典型的channel+spatial结合的模型，但是还是属于上面提到的模型，所以存在近似问题
- 然后作者收到卷积的启发，提出用卷积替代FC作为多通道、区域的注意力机制，这样不仅有效减少了参数量，而且相对FC比较好训练（这句话文中没说，是我加的），即如下面公式所示，其中A就是代表着卷积核，K代表原来就要计算的卷积，I是输入，x代表卷积操作。
- 然后在通道上用多个卷积分别对每一层通道进行注意力校准（其实就是用多个filter而已）
- 合并一下就是行下面的样子，这就是AW-Convlution

模块结构

上节提出的公式对应这里：
然后往下推就是AK，这里作者在AK这里加了个残差边的操作，目的是希望保留K的权重的同时拿到A的权重做注意力，这就是F2，接下来就是F1的实现，如下图：
上图给出了F1的公式，其中先经过平均池化，然后做两个pointwise convlutions（参见Xception中提出的卷积方法，即用N个1x1xM的卷积，得到N层特征图），以上就是模块的全部流程，值得一提的是，这玩意可以和SE/CBAM这些共用，同样有效果，且不冲突。

扫描二维码关注公众号，回复： 13362654 查看本文章

实验结果

突然发现作者似乎藏了CBAM的对比实验，想来应该是AW+CBAM的效果相对于CBAM并没有显著提升吧～，因此该方法的理论部分可能还存疑

猜你喜欢

转载自blog.csdn.net/symuamua/article/details/120933615

AW-Convlution:An Attention Module for Convolutional Neural Networks

ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks

SA-NET: SHUFFLE ATTENTION FOR DEEP CONVOLUTIONAL NEURAL NETWORKS

Attention Augmented Convolutional Networks

Convolutional Neural Networks

Convolutional Neural Networks:Application

Orthogonal Convolutional Neural Networks

论文笔记：Pervasive Attention: 2D Convolutional Neural Networks for Sequence-to-Sequence Prediction

ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks理解整理

论文阅读——ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks

【论文阅读笔记】ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks

SA-NET-轻量级注意力 | SHUFFLE ATTENTION FOR DEEP CONVOLUTIONAL NEURAL NETWORKS

Convolutional Neural Networks（week 1）——Foundations of Convolutional Neural Networks

Convolutional Neural Networks(1): Architecture

[学习笔记]convolutional neural networks

CNN (Convolutional Neural Networks) Abstract

Understanding Convolutional Neural Networks for NLP

Convolutional Neural Networks笔记（一）

Convolutional Neural Networks笔记（三）

Convolutional Neural Networks for Sentence Classification

Convolutional Neural Networks笔记（二）

Convolutional Neural Networks:Step by Step

014 Foundation of Convolutional Neural Networks

Convolutional Neural Networks (CNNs / ConvNets)

笔记：Interpretable Convolutional Neural Networks

【Python】Understanding Convolutional Neural Networks for

How Convolutional Neural Networks Work

Interpretable Convolutional Neural Networks研读

Convolutional Neural Networks: One Layer of a Convolutional Network

CBAM: Convolutional Block Attention Module

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)