面向多标签小样本学习的双流重构网络
多标签图像分类问题是计算机视觉领域的重要问题之一,它需要对图像中的所有标签进行预测.而一幅图像中待分类的标签个数往往不止一个,同时图像中对象的大小、位置和姿态的变化都会对模型的分类性能产生影响.因此,如何有效地提高图像特征的准确表达能力是一个亟需解决的难题.针对上述难题,文中提出了一个新颖的双流重构网络来对图像进行特征抽取.具体而言,该模型首先应用一个双流注意力网络来对图像进行基于通道信息和空间信息的特征提取,并经过特征拼接使得图像特征同时兼顾通道特征细节信息和空间特征细节信息.其次,该模型引入了重构损失函数,对双流网络进行特征约束,迫使上述两种分歧特征具有相同的特征表达能力,以此促使提取的双流特征共同向真值特征迫近.在基于VOC 2007和MS COCO多标签图像数据集上的实验结果表明,所提出的双流重构网络能够准确有效地提取出显著特征,并产生更好的分类精度.同时,鉴于重建损失对模型的解拟合作用,将该方法应用在小样本场景上,实验结果显示,所提模型对小样本数据同样具有较好的分类精度.
多标签图像识别;特征重构;深度学习;小样本学习;图像注意力机制
49
TP183(自动化基础理论)
上海市科技计划项目;国家自然科学基金
2022-01-21(万方平台首次上网日期,不代表论文的发表时间)
共7页
212-218