10.3969/j.issn.1000-1220.2019.02.019
利用OpenCL设计并优化FPGA上的全连接神经网络
随着深度学习神经网络的发展,FPGA上的神经网络开发获得了广泛关注.本文利用Intel FPGA提供的OpenCL SDK,在FPGA板卡上设计并实现了完整的全连接神经网络的前向模型,并针对基准系统中的存储瓶颈,通过分组划分、数据复用、优化激活函数、单指令多数据流、浮点数半精化等策略进行优化,平衡了系统中的资源占用情况,扩大了电路规模,提升了系统性能;优化后的版本与基准版本相比,得到了2.19x的加速.优化后,系统的主频达到380MHz,RAM占用率达到94%,DSP占用率达到42%.
FPGA、OpenCL、全连接神经网络、优化
40
TP311(计算技术、计算机技术)
国家重点研发计划项目 2016YFB1000403 资助
2019-05-31(万方平台首次上网日期,不代表论文的发表时间)
共5页
348-352