10.3778/j.issn.1002-8331.2206-0315
迭代Faster R-CNN的密集行人检测
行人检测是利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位.针对行人检测在密集场景下普遍存在的行人间遮挡问题,提出基于迭代Faster R-CNN的密集行人检测模型,利用一种IterDet迭代方案对Faster R-CNN进行改进,有效解决非极大值抑制(NMS)算法及其改进在选择精确度和召回率之间平衡点的难题.同时利用递归金字塔结构(RFP)进一步增强模型提取特征能力.在具有挑战性的WiderPerson和Crowd-Human数据集上进行训练和验证,实验结果表明,该模型相比Faster R-CNN在精度和召回率显著提升的同时,漏检率也明显降低.尤其在WiderPerson数据集上召回率、精度、漏检率等性能指标分别达到了97.65%、91.29%、40.43%的SOTA结果.
行人检测、密集场景、遮挡问题、Faster R-CNN、迭代方案
59
TP311.5(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;北京市教委科技计划重点项目;北京联合大学人才强校优选计划;北京联合大学人才强校优选计划;国家重点研发计划
2023-11-16(万方平台首次上网日期,不代表论文的发表时间)
共8页
214-221