DOI：10.11772/j.issn.1001-9081.2020020256

基于FPGA的卷积神经网络定点加速

引用

摘要：

针对卷积神经网络(CNN)在资源受限的硬件设备上运行功耗高及运行慢的问题,提出一种基于现场可编程门阵列(FPGA)的CNN定点计算加速方法.首先提出一种定点化方法,并且每层卷积设计不同的尺度参数,使用相对散度确定位宽的长度,以减小CNN参数的存储空间,而且研究不同量化区间对CNN精度的影响;其次,设计参数复用方法及流水线计算方法来加速卷积计算.为验证CNN定点化后的加速效果,采用了人脸和船舶两个数据集进行验证.结果表明,相较于传统的浮点卷积计算,所提方法在保证CNN精度损失很小的前提下,当权值参数和输入特征图参数量化到7-bit时,在人脸识别CNN模型上的压缩后的权重参数文件大小约为原来的22％,卷积计算加速比为18.69,同时使FPGA中的乘加器的利用率达94.5％.实验结果表明了该方法可以提高卷积计算速度,并且能够高效利用FPGA硬件资源.

关键词：卷积神经网络、定点量化、现场可编程门阵列、模型压缩、YOLO模型

所属期刊栏目：40

分类号：TP391.4(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目61672085

在线出版日期：2020-10-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：2811-2816

英文信息展示

期刊专题