10.3969/j.issn.0258-2724.20210017
多尺度注意力学习的Faster R-CNN口罩人脸检测模型
针对在佩戴口罩等有遮挡条件下的人脸检测问题,提出了多尺度注意力学习的Faster?R-CNN?(MSAF?R-CNN)人脸检测模型.?首先,为充分考虑人脸目标多尺度信息,相较于原始Faster?R-CNN框架,引入Res2Net分组残差结构,获取更细粒度的特征表征;其次,基于空间-通道注意力结构改进的Res2Net模块,结合注意力机制自适应学习目标不同尺度特征;最后,为学习目标的全局信息并减轻过拟合现象,在模型顶端嵌入加权空间金字塔池化网络,采用由粗到细的方式进行特征尺度划分.?在AIZOO和FMDD两个人脸数据集上的实验结果表明:所提出MSAF?R-CNN模型对佩戴口罩的人脸检测准确率分别达到90.37%和90.11%,验证了模型的可行性和有效性.
口罩人脸;深度学习;注意力机制;多尺度学习;特征融合;目标检测
56
TP391.41;TP183(计算技术、计算机技术)
国家自然科学基金;中央高校基本业务费专项资金;国家重点研发计划
2021-11-01(万方平台首次上网日期,不代表论文的发表时间)
共9页
1002-1010