原文地址: Multi-scale guided attention for medical image segmentation
概述
全卷积神经网络或编码器-解码器体系结构的问题:
- 尽管这两个网络具有强大的表示能力,但是这些多尺度方法导致信息流的冗余使用,例如,相似的低层特征在网络内的不同层被多次提取。
- 所学习的特征表示对像素方式的识别能力可能不足以应对某些挑战性任务,例如医学图像分割。
基于此问题作者提出了多尺度策略和注意力机制来解决此问题。
model
网络结构如下所示:
模型使用resnet的结构,先提取到四种不同大小的特征,再使用注意力机制进行融合,得到四种分割结果,最后再生成分割后的图片。
如图为channel attention的细节
如图所示为注意力机制的模块: