基于ARM+FPGA异构平台的目标检测加速模块设计与实现
为解决基于深度学习目标检测模型规模大、在边缘设备上难以部署的问题,以YOLO目标检测模型为例,设计实现基于ARM+FPGA异构平台的目标检测加速模块.该系统使用剪枝、量化后的压缩模型,在FPGA实现神经网络前向推理加速,在ARM中实现加速器调度.实验结果表明,部署至Xilinx ZCU102开发板上,该模块在200 MHz工作频率下,平均计算性能达到425.8 GOP/s,推理压缩模型速度达到30.3 fps,模块功耗为3.56 W,证明该加速模块具备可配置性.
深度学习、目标检测、模型剪枝量化、异构平台、边缘计算
58
G275.1;TP391.41;TN911.22
国家重点研发计划2018YFE0203801
2022-12-28(万方平台首次上网日期,不代表论文的发表时间)
共7页
1035-1041