10.16208/j.issn1000-7024.2022.04.040
基于重构设计的Inception网络
卷积神经网络(CNN)中大量乘加操作带来了巨大的参数量和计算量,使其在硬件加速中面临严重的访存和功耗问题.提出在4×4处理元阵列上实现同时支持1×1、3×3、5×5卷积核的28×28和32×32图像的并行重构计算方案,减少Inception网络的片上资源占用量.对输入图像进行预处理,提出一种重叠窗口的数据组织方案,将外存加载的像素数减少了30%.实验结果表明,在123 MHz的工作频率下,经过预处理的硬件访存开销降至45%,卷积计算的数据复用率达到66.7%,运行功耗为6.395 W,每瓦功率为0.176,性能较FPGA版本有明显提升.
Inception网络、阵列处理器、重构、重叠窗口、数据组织
43
TP183(自动化基础理论)
国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;陕西省国际科技合作计划基金项目;西安市科技计划基金项目;西安市科技计划基金项目
2022-04-28(万方平台首次上网日期,不代表论文的发表时间)
共7页
1195-1201