10.12132/ISSN.1673-5048.2020.0101
面向深度学习的弹载图像处理异构加速现状分析
本文分析了深度学习算法向工程应用转化存在的问题,结合陆军智能弹药的特点和发展趋势,分别从深度学习模型压缩、量化,硬件平台加速设计以及异构加速框架设计等方面进行研究,提出了面向深度学习的弹载图像处理异构加速体系,实现从算法开发到硬件异构移植的流程化设计.随后,利用DeePhi Tech的异构加速框架DNNDK对Yolo v3模型进行压缩、量化,权重压缩率90%以上,模型参数压缩率80%以上,实现了Yolo v3的轻量化设计.在DPU硬件加速架构的基础上,实现算法向弹载嵌入式平台的移植,其功耗和识别检测效率满足弹载图像处理的要求.
弹载图像、深度学习、FPGA、脉动阵列、Winograd卷积
28
TJ760;TP18(火箭、导弹)
军队十三五预研基金项目301070103
2021-08-20(万方平台首次上网日期,不代表论文的发表时间)
共8页
10-17