10.3873/j.issn.1000-1328.2022.11.011
在轨高效目标检测加速技术
针对深度卷积网络目标检测算法参数量大、计算量大以及受星上计算资源、存储资源及功耗的限制,难以实现在轨部署的问题,提出了一种在轨高效目标检测算法加速框架与实现方法.首先,设计了一种可以同时兼容三种卷积算子的计算引擎,有效提高了资源利用率;其次,从通道和卷积核两个维度将目标检测算法模型展开,实现了加速器的高度并行化和可扩展性;最后,在多种FPGA平台上实现了该加速器并对其性能进行了评估.实验结果表明:所提出的加速器计算性能可以达到1843.2 GFLOPs(每秒千兆次浮点运算),推理时间为0.22 ms.与同类加速器方案相比,所提出的加速器框架在性能、功耗、能效比及推理时间方面具有很大优势,适合部署在资源受限环境中,具有良好的星上应用前景和价值.
目标检测、模型量化、模型加速、计算强度、卷积神经网络
43
TP389.1(计算技术、计算机技术)
国家重点研发计划;中国航天科技集团公司创新基金;国家重点实验室基金;中国空间技术研究院人才基金项目
2023-01-03(万方平台首次上网日期,不代表论文的发表时间)
共13页
1544-1556