基于卷积神经网络的目标检测硬件加速器设计
基于卷积神经网络的深度学习算法的检测识别精度已远远超过了传统模式识别算法,但卷积神经网络中的卷积、非线性激活等运算,需要巨大的算力才能高效率实现,这使得很多深度学习算法模型难以在算力限制的嵌入式平台上进行部署.以目标检测算法YOLO-V3为例,针对网络的不同层设计了对应的FPGA实现方法,并且特别针对卷积层设计了分片分块并行运算的运算单元,最终在FPGA中实现了 一种目标检测硬件加速器.该加速器可充分利用FPGA的硬件计算资源,其整体平均性能为192.229 GOP/s.通过实验对比,证明该目标检测硬件加速器可以为嵌入式红外目标识别系统提供一种能效高、识别精度高的解决方案.
卷积神经网络、神经网络硬件加速器、嵌入式、目标检测
20
TP391.41(计算技术、计算机技术)
2023-01-03(万方平台首次上网日期,不代表论文的发表时间)
共7页
108-114