10.19678/j.issn.1000-3428.0058371
基于RISC-V的卷积神经网络专用指令集处理器
针对x86和ARM商用架构CPU因专利、授权导致定制成本过高和灵活性不够的问题,面向物联网领域提出一种基于RISC-V开源指令集的卷积神经网络(CNN)专用指令集处理器.通过自定义拓展指令调用加速器对轻量化CNN中的卷积和池化操作进行加速,提高终端设备能效.在此过程中,配置CNN各层信息控制加速器进行分组运算,以适应不同大小的输入数据,同时调整加速器的数据通路,对耗时操作进行单独或结合运算,以适应不同的轻量化网络.FPGA平台验证结果表明,该处理器在100 MHz工作频率下推理SqueezeNet网络,耗时约40.89 ms,功耗为1.966W,较手机处理器单核计算速度更快,与AMD Ryzen7 3700X、NVIDIA RTX2070 Super和Qualcomm Snapdragon 835平台相比,其消耗资源少、功耗低,在性能功耗比上也具有优势.
RISC-V指令集;卷积神经网络;领域专用架构;专用指令集处理器;硬件加速
47
TP332(计算技术、计算机技术)
广东省重点领域研发计划项目2018B010142001
2021-09-15(万方平台首次上网日期,不代表论文的发表时间)
共9页
196-204