10.19678/j.issn.1000-3428.0065985
融合多尺度语义和剩余瓶颈注意力的医学图像分割
在实际应用中U-Net由于使用单一卷积核以及跳跃连接运算时编解码器间存在语义差距,导致分割不同类型的医学图像时泛化性能降低.鉴于此,基于U-Net结构构建一种轻量灵活的医学图像分割模型(LFUNet).在编码器和解码器上,构建多尺度语义(MS)模块,每个MS模块使用不同的小卷积核序列等价代替较大的卷积核进行卷积运算,获得不同的感受野,从而捕获不同层次的语义特征.建立集成剩余瓶颈结构和注意力机制的剩余瓶颈注意力(RBA)模块,跳跃连接嵌入RBA模块后能缩小编码器和解码器的语义差距,且使模型更关注目标区域.MS模块的小卷积核序列和RBA模块的逆残差结构具有较少的参数量,从而使LFUNet的总参数量仅为U-Net的1/3,大幅降低了模型复杂度并提高了网络运行效率.在4个公共生物医学图像数据集上的对比实验结果表明,LFUNet的Jaccard系数均值相比于U-Net分别提高了3.1846、11.9366、4.2438、0.1144个百分点,具有更高的分割精度及泛化性能.
深度学习、语义分割、U-Net结构、剩余瓶颈结构、注意力机制
49
TP391(计算技术、计算机技术)
国家自然科学基金;中国博士后科学基金;山东省自然科学基金
2023-10-20(万方平台首次上网日期,不代表论文的发表时间)
共9页
162-170