10.19734/j.issn.1001-3695.2022.12.0809
基于知识蒸馏与目标区域选取的细粒度图像分类方法
细粒度图像分类任务由于自身存在的细微的类间差别和巨大的类内差别使其极具挑战性,为了更好地学习细粒度图像的潜在特征,该算法将知识蒸馏引入到细粒度图像分类任务中,提出基于知识蒸馏与目标区域选取的细粒度图像分类方法(TRS-DeiT),能使其兼具CNN模型和Transformer模型的各自优点.此外,TRS-DeiT的新型目标区域选取模块能够获取最具区分性的区域;为了区分任务中的易混淆类,引入对抗损失函数计算不同类别图像间的相似度.最终,在三个经典细粒度数据集CUB-200-2011、Stanford Cars和Stanford Dogs上进行训练测试,分别达到90.8%、95.0%、95.1%的准确率.实验结果表明,该算法相较于传统模型具有更高的准确性,通过可视化结果进一步证实该算法的注意力主要集中在识别对象,从而使其更擅长处理细粒度图像分类任务.
细粒度图像分类、知识蒸馏、Transformer、深度学习
40
TP391.41(计算技术、计算机技术)
国家自然科学基金;天津市企业科技特派员项目
2023-10-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
2863-2868