DOI：10.1360/SST-2021-0088

基于动态稀疏和特征学习增强的模型剪枝

引用

摘要：

为了减轻深度学习算法在实际应用中庞大的参数量和繁重的计算量,剪枝已经被广泛地应用在模型压缩任务中.然而,大多数剪枝方法仅仅利用已经训练好的模型参数作为训练的初始参数,而模型本身的特征信息没有被利用.为此,本文提出了一种基于模型特征学习增强的动态剪枝方法,在训练过程中,提出的方法不需要数据集类别标签.一方面,本文利用基准模型(训练好的模型)输出的预测类别信息和中间层特征作为监督信息指导压缩子模型的任务学习,增强了压缩模型学习基准模型特征的能力;另一方面,本文利用不同压缩子模型的输出信息互相学习,增强了压缩子模型之间特征学习的能力.此外,本文使用一种动态的结构化稀疏正则方式,仅仅在预期稀疏的参数上施加正则,同时使用基于泰勒级数的通道敏感性准则确定预期稀疏参数.在优化过程中,本文使用动态稀疏的迭代阈值收缩算法(iterative shrinkage-thresholding algorithm,ISTA)求解器解决了约束剪枝率的优化问题.模型训练结束后,提出的方法直接移除冗余的参数,剪枝后的模型不需要微调.在多个网络结构和数据集下,本文提出的方法均获得了很好的压缩性能.

关键词：深度卷积神经网络、模型压缩、特征学习、剪枝、结构化稀疏

所属期刊栏目：52

分类号：TP391;TP183;TN911.7

资助基金：国家重点研发计划;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;中国科学院前沿科学重点研究计划项目;广东省自然科学基金;中国科学院青年创新促进会项目

在线出版日期：2022-07-29（万方平台首次上网日期，不代表论文的发表时间）

页数：共15页

页码：667-681

英文信息展示

期刊专题