10.16208/j.issn1000-7024.2022.12.020
注意力引导多模态融合的R GB-D图像分割
为提高图像分割效率,提出注意力引导多模态交叉融合分割网络(ACFNet).采用编码器-解码器结构,设计非对称双流特征提取网络,RGB和深度编码器分别以ResNet-101和ResNet-50为主干网络,并在RGB编码器中添加全局-局部特征提取模块(GL).为有效融合RGB和深度特征,提出注意力引导多模态交叉融合模块(ACFM),在多阶段利用融合的增强特征表示.实验结果表明,ACFNet在室内场景分割数据集NYUD V2上的平均交并比(mIou)达到了51.5%,与先进的语义分割算法相比,显著提高了分割性能.
RGB-D图像、语义分割、注意力机制、多模态融合、深度学习、特征提取、编码器-解码器
43
TP391(计算技术、计算机技术)
山西省回国留学人员科研基金项目2020-113
2023-01-05(万方平台首次上网日期,不代表论文的发表时间)
共8页
3453-3460