10.12141/j.issn.1000-565X.220684
基于特征空间嵌入的对比知识蒸馏算法
因能有效地压缩卷积神经网络模型,知识蒸馏在深度学习领域备受关注.然而,经典知识蒸馏算法在进行知识迁移时,只利用了单个样本的信息,忽略了样本间关系的重要性,算法性能欠佳.为了提高知识蒸馏算法知识迁移的效率和性能,文中提出了一种基于特征空间嵌入的对比知识蒸馏(FSECD)算法.该算法采用批次内构建策略,将学生模型的输出特征嵌入到教师模型特征空间中,使得每个学生模型的输出特征和教师模型输出的N个特征构成N个对比对.每个对比对中,教师模型的输出特征是已优化、固定的,学生模型的输出特征是待优化、可调优的.在训练过程中,FSECD缩小正对比对的距离并扩大负对比对的距离,使得学生模型可感知并学习教师模型输出特征的样本间关系,进而实现教师模型知识向学生模型的迁移.在CIFAR-100和ImageNet数据集上对不同师生网络架构进行的实验结果表明,与其他主流蒸馏算法相比,FSECD算法在不需要额外的网络结构和数据的情况下,显著提升了性能,进一步证明了样本间关系在知识蒸馏中的重要性.
图像分类、知识蒸馏、卷积神经网络、深度学习、对比学习
51
TP391(计算技术、计算机技术)
广东省重点领域研发计划项目2021B0101420003
2023-05-31(万方平台首次上网日期,不代表论文的发表时间)
共11页
13-23