10.3778/j.issn.1673-9418.2003008
改进YOLOV3算法的视频目标检测
由于监控中的行人检测存在背景复杂,目标尺度和姿态多样性及人与周围物体互相遮挡的问题,造成YOLOV3对部分目标检测不准确,会产生误检、漏检或重复检测的情况.因此,在YOLOV3的网络基础上,利用残差结构思想,将浅层特征和深层特征进行上采样连接融合得到104×104尺度检测层,并将K-means算法聚类得到的边界框尺寸应用到各尺度网络层,增加网络对多尺度、多姿态目标的敏感度,提高检测效果.同时,利用预测框对周围其他目标的斥力损失更新YOLOV3损失函数,使预测框向正确的目标靠近,远离错误的目标,降低模型的误检率,以改善目标间互相遮挡而影响的检测效果.实验结果证明,在MOT16数据集上,相比YOLOV3算法,提出的网络模型具有更好的检测效果,证明了方法的有效性.
目标检测、YOLOV3算法、斥力损失、深度学习、视频理解
15
TP391(计算技术、计算机技术)
北京市自然科学基金_海淀原始创新联合基金;国家自然科学基金
2021-01-15(万方平台首次上网日期,不代表论文的发表时间)
共10页
163-172