10.12141/j.issn.1000-565X.220623
基于FPGA并行加速的脉冲神经网络在线学习硬件结构的设计与实现
当前,基于数字电路的脉冲神经网络硬件设计,在学习功能方面的突触并行性不高,导致硬件整体延时较大,在一定程度上限制了脉冲神经网络模型在线学习的速度.针对上述问题,文中提出了一种基于FPGA并行加速的高效脉冲神经网络在线学习硬件结构,通过神经元和突触的双并行设计对模型的训练与推理过程进行加速.首先,设计具有并行脉冲传递功能和并行脉冲时间依赖可塑性学习功能的突触结构;然后,搭建输入编码层和赢家通吃结构的学习层,并优化赢家通吃网络的侧向抑制的实现,形成规模为784~400的脉冲神经网络模型.实验结果表明:在MNIST数据集上,使用该硬件结构的脉冲神经网络模型训练一幅图像需要的时间为1.61 ms、能耗约为3.18 mJ,推理一幅图像需要的时间为1.19 ms、能耗约为2.37 mJ,识别MNIST测试集样本的准确率可达87.51%;在文中设计的硬件框架下,突触并行结构能使训练速度提升38%以上,硬件能耗降低约24.1%,有助于促进边缘智能计算设备及技术的发展.
神经网络、学习算法、加速、并行结构
51
TP389.1(计算技术、计算机技术)
广东省重点领域研发计划项目;广东省重点领域研发计划项目;广州市基础研究计划基础与应用基础研究项目;广东省教育厅创新人才项目;广东工业大学青年百人计划项目
2023-05-31(万方平台首次上网日期,不代表论文的发表时间)
共10页
104-113