基于多尺度特征融合的人群计数算法
针对密集场景下人群目标尺度变化大导致识别精度不高的问题,本文提出两种多尺度特征融合结构:注意力加权融合模块(attention-weighted fusion module,AWF)和自底向上融合模块(bottom-up fusion module,BUF).其中AWF模块引入注意力分支学习特征图的权重,并将加权后的多层尺度特征进行叠加.而BUF模块在处理特征图时使用空洞卷积捕获更多尺度信息,且浅层特征图采用拼接方式融合.经过融合模块处理的特征图具有更强的表达能力,预测的密度图更加精准.本文算法以ResNet50为骨干网络提取特征,分别使用AWF和BUF模块进行特征融合,在公开数据集上进行实验.结果显示加入AWF模块的计数算法在Shanghai Tech数据集上的平均绝对误差(MAE)降到45.54(A部分)和7.6(B部分),均方误差(MSE)降到100.28(A部分)和11.4(B部分),在UCF_CC_50数据集上的MAE和MSE则降至212.42和323.06.而加入BUF模块后的算法在Shanghai Tech数据集上的MAE则为51.6(A部分)、8.0(B部分),MSE降到102(A部分)和12.8(B部分),在UCF_CC_50数据集上的MAE和MSE为242.6和359.5.实验结果表明,本文提出的AWF模块和BUF模块都可以有效融合深层与浅层的特征信息,优化特征图,提高计数精度.
人群计数;多尺度信息;特征融合;注意力加权融合;空洞卷积
31
国家自然科学基金;高铁联合基金;四川省重点研发计划
2022-01-21(万方平台首次上网日期,不代表论文的发表时间)
共10页
226-235