10.16208/j.issn1000-7024.2023.03.022
改进YOLOv4的人脸口罩检测与硬件加速
针对YOLOv4的人脸口罩检测参数量和计算量大,难以部署到硬件资源有限的嵌入式设备问题,提出一种轻量型YOLOv4算法,并设计卷积神经网络硬件加速器.将骨干网络替换成MobileNetv2,使用深度可分离卷积替换掉部分普通卷积,压缩网络结构;改进SPP模块以满足Vitis AI支持的池化窗口尺寸;在颈部网络中,增加CSP结构使网络更容易优化.实验结果表明,改进的算法牺牲0.25%的检测精度,压缩84.42%的模型大小.在ZYNQ上,mAP达到95.16%,DPU平均利用率减少38%.
现场可编程门阵列、硬件加速、轻量化网络、YOLOv4、空间金字塔池化、人脸口罩检测、深度可分离卷积
44
TP391.41(计算技术、计算机技术)
广西科技重点基金项目;广西研究生教育创新基金项目
2023-05-08(万方平台首次上网日期,不代表论文的发表时间)
共9页
798-806