摘要

由于在Transformer中的Patch划分操作，在分割预测结果中仍然存在着严重的块状和裁剪边缘问题。在这项工作中，我们提出了一种新的u型结构的医学图像分割借助于新引入的焦点调制机制。所提出的架构具有不对称的编码器和解码器深度。由于焦点模块能够聚合局部和全局特征，我们的模型可以同时受益于Transformer的全局感受野和cnn的局部细节特征。这有助于所提出的方法平衡局部和全局特征的使用。

本文的主要贡献为：1）使用焦点模块作为u型架构的基础块2）加大了编码器层的深度，增强U型架构的问题建模能力。

方法

本文提出的网络结构Focal-UNet如下图所示：它由一个编码器，Bottleneck，解码器以及一个跳跃连接组成

编码器

编码器是由三个focal layers组成的，每个focal layer层包括4个focal module（FM）块和一个下采样卷积块，对网络的接受域更大，从输入特征向量中提取出更多可泛化特征的能力更高。更高的接受域有助于网络在训练过程中考虑更多的可泛化特征，这似乎对分割问题有效。此外，这个块的计算效率更高，综上所述，这个FM块似乎很适合用作构建u型架构的基础块。在每一层中增加一个卷积块的目的是减小图像大小并增加通道数量，这在设计u型架构时是很常见的。

Bottleneck

Bottleneck是基于四个FM块构建的，从输入中提取更深层次的特征，并增加网络的容量，以建模更复杂的问题空间。

解码器

解码器的构造类似于编码器部分，主要的区别在于每一层中使用了一个FM块和一个转置卷积进行上采样，并将每一层的通道数量减少为原来的2倍

跳跃连接

U型网络的关键在于跳跃连接，它使得网络同时使用更高和更低级别的特征来构建出所需的输出，我们还在提出的体系结构中使用了类似于U型网络中跳跃连接以促进输入到输出的特征传输，跳跃连接

总结

本文提出了一种新的基于焦点的u型结构的医学图像分割方法。因此，我们的focus - unet模型在Synapse数据集上取得了比最先进的方法更好的结果。此外，我们的实验表明，对于小型训练集，与Swin-UNet相比，所提出的FocalUNet具有出色的性能和泛化能力。

Focal-UNet

摘要

方法

编码器

Bottleneck

解码器

总结

猜你喜欢