10.11772/j.issn.1001-9081.2020020256
基于FPGA的卷积神经网络定点加速
针对卷积神经网络(CNN)在资源受限的硬件设备上运行功耗高及运行慢的问题,提出一种基于现场可编程门阵列(FPGA)的CNN定点计算加速方法.首先提出一种定点化方法,并且每层卷积设计不同的尺度参数,使用相对散度确定位宽的长度,以减小CNN参数的存储空间,而且研究不同量化区间对CNN精度的影响;其次,设计参数复用方法及流水线计算方法来加速卷积计算.为验证CNN定点化后的加速效果,采用了人脸和船舶两个数据集进行验证.结果 表明,相较于传统的浮点卷积计算,所提方法在保证CNN精度损失很小的前提下,当权值参数和输入特征图参数量化到7-bit时,在人脸识别CNN模型上的压缩后的权重参数文件大小约为原来的22%,卷积计算加速比为18.69,同时使FPGA中的乘加器的利用率达94.5%.实验结果表明了该方法可以提高卷积计算速度,并且能够高效利用FPGA硬件资源.
卷积神经网络、定点量化、现场可编程门阵列、模型压缩、YOLO模型
40
TP391.4(计算技术、计算机技术)
国家自然科学基金资助项目61672085
2020-10-20(万方平台首次上网日期,不代表论文的发表时间)
共6页
2811-2816