10.11896/j.issn.1002-137X.2018.08.004
可伸缩模块化CNN人群计数方法
本文目标是根据任意视角、任意人群密度的图像信息,估计真实场景中的人群密度.但三维空间景物投影到二维空间时会造成透视失真和人群遮挡问题,导致难以区分个体与个体、个体与背景的差异.为此,提出一种灵活高效的可伸缩模块化卷积神经网络(CNN)的架构,允许直接输入任意大小和分辨率的图像,不额外计算视角变化信息,通过生成密度图的方式来估计人群数量.架构的每个模块采用不同卷积核的多列结构,可以拟合不同远近的个体信息;并结合前后两层的特征信息,减少了梯度消失造成的精度下降损失.实验证明,在ShanghaiTech PartA和PartB数据集上,所提方法的准确率比之前最好的MCNN方法分别提高了14.58%,40.53%,均方根误差分别降低了23.89%,33.90%.
人群计数、卷积神经网络、可伸缩模块、密度图、特征融合
45
TP391(计算技术、计算机技术)
属性学习及其应用研究61473149;2017年国家重点研发计划"网络空间安全"重点专项2017YFB0802800
2018-09-06(万方平台首次上网日期,不代表论文的发表时间)
共6页
17-21,40