改进YOLOV3算法的视频目标检测

引用

摘要：

由于监控中的行人检测存在背景复杂,目标尺度和姿态多样性及人与周围物体互相遮挡的问题,造成YOLOV3对部分目标检测不准确,会产生误检、漏检或重复检测的情况.因此,在YOLOV3的网络基础上,利用残差结构思想,将浅层特征和深层特征进行上采样连接融合得到104×104尺度检测层,并将K-means算法聚类得到的边界框尺寸应用到各尺度网络层,增加网络对多尺度、多姿态目标的敏感度,提高检测效果.同时,利用预测框对周围其他目标的斥力损失更新YOLOV3损失函数,使预测框向正确的目标靠近,远离错误的目标,降低模型的误检率,以改善目标间互相遮挡而影响的检测效果.实验结果证明,在MOT16数据集上,相比YOLOV3算法,提出的网络模型具有更好的检测效果,证明了方法的有效性.

关键词：目标检测、YOLOV3算法、斥力损失、深度学习、视频理解

所属期刊栏目：15

分类号：TP391(计算技术、计算机技术)

资助基金：北京市自然科学基金_海淀原始创新联合基金;国家自然科学基金

在线出版日期：2021-01-15（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：163-172

英文信息展示

期刊专题