10.19678/j.issn.1000-3428.0060111
结合双语义数据增强与目标定位的细粒度图像分类
细粒度图像分类旨在对属于同一基础类别的图像进行更细致的子类划分,其较大的类内差异和较小的类间差异使得提取局部关键特征成为关键所在.提出一种结合双语义数据增强与目标定位的细粒度图像分类算法.为充分提取具有区分度的局部关键特征,在训练阶段基于双线性注意力池化和卷积块注意模块构建注意力学习模块和信息增益模块,分别获取目标局部细节信息和目标重要轮廓这2类不同语义层次的数据,以双语义数据增强的方式提高模型准确率.同时,在测试阶段构建目标定位模块,使模型聚焦于分类目标整体,从而进一步提高分类准确率.实验结果表明,该算法在CUB-200-2011、FGVC Aircraft和Stanford Cars数据集中分别达到89.5%、93.6%和94.7%的分类准确率,较基准网络Inception-V3、双线性注意力池化特征聚合方式以及B-CNN、RA-CNN、MA-CNN等算法具有更好的分类性能.
细粒度图像分类;数据增强;双线性网络;注意力学习;目标定位
48
TP391.41(计算技术、计算机技术)
广东省重点区域研究开发计划项目;广东工业大学青年百人项目
2022-02-24(万方平台首次上网日期,不代表论文的发表时间)
共7页
237-242,249