10.3969/j.issn.1000-8519.2021.18.020
基于赛灵思XC72020的神经网络加速算法设计
为满足低功耗、低延迟的小目标探测任务,提出一种基于FPGA的深度神经网络加速模块以加速计算.本文针对以SkyNet为代表的自下而上的网络架构,利用Xilinx公司提供的集成开发环境进行优化设计.在该架构下,通过量化浮点型数据为整型数据以降低数据存储量从而进一步优化带宽;在计算模块中,设计了数据流水化等高效率计算结构,兼顾了计算性能与资源消耗.实验结果表明,网络部署到Xilinx的XC7Z020芯片上,在充分利用了DSP资源的情况下,处理1000张320*160的RGB图像平均需要303.06s.
FPGA;硬件加速器;深度神经网络;目标检测
国家自然科学基金资助项目;东北林业大学大学生创新创业训练项目
2021-12-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
58-60