在物联网资源受限的MCU上部署深度压缩神经网络

引用

摘要：

物联网微处理器单元(MCU)的随机存取存储器容量小(64～2 048 kB),是物联网(IoT)发展的最大挑战之一.现有的神经网络压缩算法大多是为了减小深度神经网络(DNN)的模型尺寸,使其能够适应有限的存储空间,并没有显著减少中间特征映射的大小,即使经过压缩,神经网络也有可能不能在微处理器单元中运行.为了在资源受限的物联网微处理器单元上,部署深度神经网络来实现嵌入式设备的智能,提出了一个轻量级的运行时工作内存压缩方法,来动态修剪中间输出特征映射值,使工作内存减少到比RAM还小,以确保能够适应有限的内存.实验结果表明,该方法能够显著降低深度神经网络的工作内存,以满足物联网微处理器RAM大小的约束,同时在内存开销和运行时延相对较低的情况下保持输出推论的准确性.

关键词：微处理器、人工智能、神经网络、轻量级、压缩、边缘计算

所属期刊栏目：41

分类号：TP311(计算技术、计算机技术)

资助基金：广东省普通高校特色创新类项目2021KTSCX160

在线出版日期：2022-05-16（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：147-156

英文信息展示

期刊专题