改进YOLOv4算法的复杂视觉场景行人检测方法

引用

摘要：

复杂视觉场景下存在过暗或者过曝的光照、恶劣的天气、严重遮挡、行人尺寸差别大以及图像模糊等问题,大大增加了行人检测的难度.因此,针对复杂视觉场景下行人检测准确度低、漏检严重的问题,提出了改进的YOLOv4算法以增强复杂视觉场景下的行人检测效果.首先,构建复杂视觉场景下的行人数据集.然后,在主干网中加入混合空洞卷积,提高网络对行人特征的提取能力.最后,提出空间锯齿空洞卷积结构,代替空间金字塔池化结构,获取更多细节特征.实验表明,在本文构建的行人数据集上,改进后的YOLOv4算法的平均精度(average precision,AP)达到了90.08％,相比原YOLOv4算法提高了7.2％,对数平均漏检率(log-average miss rate,LAMR)降低了13.69％.

关键词：复杂视觉场景;YOLOv4;混合空洞卷积;空间锯齿空洞卷积

所属期刊栏目：37

分类号：TP393(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目No.U1866209.No.61772162

在线出版日期：2021-09-15（万方平台首次上网日期，不代表论文的发表时间）

页数：共11页

页码：46-56

英文信息展示

期刊专题