深度学习行人检测方法综述

引用

摘要：

行人检测技术在智能交通系统、智能安防监控和智能机器人等领域均表现出了极高的应用价值,已经成为计算机视觉领域的重要研究方向之一.得益于深度学习的飞速发展,基于深度卷积神经网络的通用目标检测模型不断拓展应用到行人检测领域,并取得了良好的性能.但是由于行人目标内在的特殊性和复杂性,特别是考虑到复杂场景下的行人遮挡和尺度变化等问题,基于深度学习的行人检测方法也面临着精度及效率的严峻挑战.本文针对上述问题,以基于深度学习的行人检测技术为研究对象,在充分调研文献的基础上,分别从基于锚点框、基于无锚点框以及通用技术改进(例如损失函数改进、非极大值抑制方法等)3个角度,对行人检测算法进行详细划分,并针对性地选取具有代表性的方法进行详细结合和对比分析.本文总结了当前行人检测领域的通用数据集,从数据构成角度分析各数据集应用场景.同时讨论了各类算法在不同数据集上的性能表现,对比分析各算法在不同数据集中的优劣.最后,对行人检测中待解决的问题与未来的研究方法做出预测和展望.如何缓解遮挡导致的特征缺失问题、如何应对单一视角下尺度变化问题、如何提高检测器效率以及如何有效利用多模态信息提高行人检测精度,均是值得进一步研究的方向.

关键词：行人检测、深度学习、卷积神经网络(CNN)、遮挡目标检测、小目标检测

所属期刊栏目：27

分类号：TP391(计算技术、计算机技术)

资助基金：国家重点研发计划;国家自然科学基金;上海市重点实验室项目

在线出版日期：2022-07-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共18页

页码：2094-2111

英文信息展示

期刊专题