YOLO v4框架下Multi-Patch多帧增量式交通视频目标检测

引用

摘要：

提升目标检测模型的泛化能力是计算机视觉领域的研究热点和关键难点.本文提出了一种Multi-Patch方法和多帧增量式预测策略,提升了不同场景下交通视频目标检测的稳健性,有效解决了目标尺度多变导致的视频中目标召回率低的问题.根据视频分辨率和目标尺寸,基于Multi-Patch方法自动将视频帧分割成最佳输入尺寸,使用YOLO v4神经网络并关联连续帧的上下文信息,采用增量式预测策略降低视频目标检测的漏检率,提升不同场景下视频目标的检测置信度得分和召回率.采集不同拍摄条件下的交通视频,验证该方法的有效性.试验结果表明,本文提出的目标检测方法召回率在80％以上,置信度平均得分在0.84以上.

关键词：视频目标检测、多帧融合、YOLO v4、卷积神经网络

分类号：P237(摄影测量学与测绘遥感)

资助基金：广东省科技创新战略专项;自然资源部城市土地资源监测与仿真重点实验室开放基金

在线出版日期：2022-06-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：38-44

英文信息展示

期刊专题