多尺度特征图融合的目标检测

引用

摘要：

目的自然场景图像中,特征提取的质量好坏是决定目标检测性能高低的关键因素.大多数检测算法都是利用卷积神经网络(CNN)强大的学习能力来获得目标的先验知识,并根据这些知识进行目标检测.卷积神经网络的低层次特征缺乏特征的代表性,而高层次的特征则对小尺度目标的监测能力弱.方法利用原始SSD(single shot multiBox detector)网络提取特征图,通过1×1卷积层将提取的特征图统一为256维;通过反卷积操作增加自顶向下特征图的空间分辨率;通过对应元素相加的操作,将两个方向的特征图进行融合.将融合后的特征图采用3×3的卷积核进行卷积操作,减小特征图融合后的混叠效应.根据以上步骤构建具有较强语义信息的特征图,同时保留原有特征图的细节信息;对预测框进行聚合,利用非极大抑制(NMS)实现最终的检测效果.结果在PASCALVOC 2007和PASCAL VOC 2012数据集上进行实验测试,该模型的mAP(mean average precision)为78.9％和76.7％,相对于经典的SSD算法,分别提高了1.4％和0.9％;此外,本文方法在检测小尺度目标时相较于经典SSD模型mAP提升了8.3％.结论提出了一种多尺度特征图融合的目标检测算法,以自顶向下的方式扩展了语义信息,构造了高强度语义特征图用于实现精确目标检测.

关键词：计算机视觉、深度学习、卷积神经网络、目标检测、多尺度特征图

所属期刊栏目：24

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金项目61172144;辽宁省自然科学基金项目20170540426;辽宁省教育厅项目LJ2017QL034;辽宁省教育厅一般项目LJYL049

在线出版日期：2019-12-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共14页

页码：1918-1931

英文信息展示

期刊专题