10.16157/j.issn.0258-7998.174161
深度学习中的卷积神经网络系统设计及硬件实现
针对目前深度学习中的卷积神经网络(CNN)在CPU平台下训练速度慢、耗时长的问题,采用现场可编程门阵列(FPGA)硬件平台设计并实现了一种深度卷积神经网络系统.该系统采用修正线性单元(ReLU)作为特征输出的激活函数并使用Softmax函数作为输出分类器.利用流水线技术并针对每一层的特征运算进行了并行处理,从而能够在1个系统时钟周期内完成整个CNN中的295次卷积运算.系统最后采用MNIST数据集作为实验样本,实验结果表明,在50 MHz的工作频率下,FPGA的训练用时相较于通用CPU的训练用时提升了8.7倍,经过2 000次迭代后系统识别的准确率为92.42%.
深度学习、卷积神经网络、FPGA、并行处理
44
TP391(计算技术、计算机技术)
贵州省科技厅联合基金项目黔科合LH字[2014]7630;贵州省普通高等学校智能物联网工程中心建设项目黔教合KY字[2016]016;贵州省功率元器件可靠性重点实验室开发基金项目KFJJ201602;贵州大学引进人才科研项目贵大人基合字201553号
2018-06-11(万方平台首次上网日期,不代表论文的发表时间)
共4页
56-59