10.3969/j.issn.1671-7449.2021.06.010
基于语义信息的场景识别方法研究
在场景识别任务中,由于场景图像类内变化大,类间相似度高,不同场景类别之间表现出相似的外观和对象分布,从而容易导致场景识别任务的失败.为解决该问题,本文提出一种基于语义分割及高效网络相结合的场景识别模型.该模型由语义分支和RGB分支两部分组成,语义分支在语义分割基础上进一步提取图像上下文信息,RGB分支采用高效网络来提取图像的全局特征,通过注意力机制将两个分支的输出特征进行融合,最终输入线性分类器以实现场景识别的预测.将提出的网络模型在ADE20K,MIT Indoor 67和SUN3973个数据集进行训练与测试,实验结果表明,提出的模型可以显著减少网络参数数量,同时提高场景识别的准确率.
场景识别;语义分割;高效网络;注意力机制;多模态特征融合
35
TP391.4(计算技术、计算机技术)
山西省研究生教育改革课题资助项目;山西大学物理电子工程学院课程思政建设资助项目
2021-12-23(万方平台首次上网日期,不代表论文的发表时间)
共8页
521-528