多教师对比知识反演的无数据模型压缩方法

引用

摘要：

知识蒸馏是用于压缩深度神经网络的一种有效方法,但是由于用户数据隐私保护、数据机密性或传输的限制,很多时候人们无法获取到原始数据.现有的无数据知识蒸馏方法仅使用单教师模型进行有偏特征统计,生成的数据和原始数据相比存在着多样性和泛化性差问题,从而导致压缩后模型的准确率不高.为了解决此类问题,提出了一种多教师对比知识反演的无数据模型压缩方法(MTCKI),该方法从多个可用的教师模型中提取知识并将其融合到学生模型中,以消除模型有偏统计带来的偏差,增强了合成图片的泛化性.为提升合成的图像多样性,采用对比学习的策略将当前批次生成的图像与历史的图像进行对比,迫使生成器合成与历史不相似的图片.同时,提出多教师-学生对比的策略,进一步提升学生网络的表征能力.实验表明,该方法不仅能生成视觉上令人满意的图像,而且在多个指标上优于现有的方法.生成的合成图像更接近原始数据集的分布,而且只需要一次生成的图片数据集就能泛化用于不同模型训练.

关键词：模型压缩、无数据、知识蒸馏、数据保护、隐私保护

所属期刊栏目：17

分类号：TP391(计算技术、计算机技术)

在线出版日期：2023-11-16（万方平台首次上网日期，不代表论文的发表时间）

页数：共13页

页码：2721-2733

英文信息展示

期刊专题