基于多级叠加和注意力机制的图像语义分割

引用

摘要：

针对目标空间复杂度高容易造成小尺度目标丢失和边界分割不连续等问题,借鉴DeepLabv3+网络结构,建立基于多级叠加和注意力机制的图像语义分割模型.在编码器阶段,采用不同尺度的平均池化操作构建多尺度平均池化模块,使用不同扩张率的空洞卷积组成多尺度叠加模块扩大卷积运算的感受野,增强对局部特征的获取能力,并利用由通道和空间组成的注意力机制模块抑制无意义的特征,增强有意义的特征,提高对小尺度目标及局部边界的分割精度.在解码器阶段,通过双线性插值法对特征图进行分辨率恢复,并结合通道维度信息进行像素填充补充特征信息,并使用Softmax激活函数进行语义分割的输出预测.实验结果表明,该模型在PASCAL VOC2012和SUIM公开数据集上的平均交并比分别达到85.6%和60.8%,在整体分割精度和小尺度图像的分割效果上明显优于多数图像语义分割模型.

关键词：语义分割、小尺度目标、注意力机制、多尺度叠加、多尺度平均池化

所属期刊栏目：49

分类号：TP312(计算技术、计算机技术)

资助基金：黑龙江省自然科学基金项目;哈尔滨商业大学研究生创新科研项目;哈尔滨商业大学教师创新支持计划项目

在线出版日期：2023-09-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：265-271,278

英文信息展示

期刊专题