10.19678/j.issn.1000-3428.0059351
轻量化神经网络加速器的设计与实现
针对以MobileNet为代表的轻量化卷积网络,基于现场可编程门阵列平台设计网络加速器.通过优化DW、PW轻量化模块并实现常用的卷积、ReLU等功能模块,满足神经网络加速器低功耗、低时延的要求,同时基于指令设计使加速器支持MobileNet及各类变种.利用上位机配置YoloV3 tiny(不含轻量模块)指令和YoloV3&MobileNet(含轻量模块)指令进行目标检测,实验结果表明,该网络加速器具有较快的推断速度,用于YoloV3 tiny结构时达到85 frame/s,用于YoloV3&MobileNet结构时达到62 frame/s.
硬件加速;模型压缩;轻量化神经网络;现场可编程门阵列;并行计算
47
TP391(计算技术、计算机技术)
广东省自然科学基金;广东省科技计划项目
2021-11-10(万方平台首次上网日期,不代表论文的发表时间)
共7页
185-190,196