多尺度条形池化与通道注意力的图像语义分割

引用

摘要：

目的针对自然场景下图像语义分割易受物体自身形状多样性、距离和光照等因素影响的问题,本文提出一种新的基于条形池化与通道注意力机制的双分支语义分割网络(strip pooling and channel attention net,SPCANet).方法 SPCANet从空间与内容两方面对图像特征进行抽取.首先,空间感知子网引入1维膨胀卷积与多尺度思想对条形池化技术进行优化改进,进一步在编码阶段增大水平与竖直方向上的感受野;其次,为了提升模型的内容感知能力,将在ImageNet数据集上预训练好的VGG16(Visual Geometry Group 16-layer network)作为内容感知子网,以辅助空间感知子网优化语义分割的嵌入特征,改善空间感知子网造成的图像细节信息缺失问题.此外,使用二阶通道注意力进一步优化网络中间层与高层的特征选择,并在一定程度上缓解光照产生的色差对分割结果的影响.结果使用Cityscapes作为实验数据,将本文方法与其他基于深度神经网络的分割方法进行对比,并从可视化效果和评测指标两方面进行分析.SPCANet在目标分割指标mIoU(mean intersection over union)上提升了1.2％.结论提出的双分支语义分割网络利用改进的条形池化技术、内容感知辅助网络和通道注意力机制对图像语义分割进行优化,对实验结果的提升起到了积极作用.

关键词：图像分割、注意力、条形池化、膨胀卷积、感受野

所属期刊栏目：27

分类号：TP389.1(计算技术、计算机技术)

资助基金：黑龙江省自然科学基金项目LH2021F046

在线出版日期：2022-12-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共12页

页码：3530-3541

英文信息展示

期刊专题