基于深度互学习的多标记零样本分类

引用

摘要：

目前已有大量方案解决零样本图像分类问题,但对多标记零样本图像分类问题的研究很少,在现有的解决方案中,模型在训练时除了利用已标注的数据集和给定的先验知识外,只利用图像区域信息或只利用标签语义信息.基于深度互学习技术,提出一种能同时利用图像区域和标签语义两种信息的解决方法.设计两个子网络,将子网络1用于增强图像视觉特征,通过多头自注意机制关联图像中不同区域的特征信息,得到基于区域的视觉特征表示,再将该特征表示映射到语义空间中,并输出预测概率分布;使子网络2用于融合标签语义信息与图像视觉特征,通过计算标签和图像区域特征的相关性,得到基于语义的视觉特征表示,将特征表示映射到语义空间中输出概率分布.最后引入深度互学习技术,利用两个子网络得到的概率分布为对方提供训练经验以进行互相学习,该过程中子网络在训练自身分类性能的同时也学习对方的训练经验,有效提升多标记零样本图像分类的性能.实验结果表明,所提方法在MS COCO数据集上的F1值相比Deep0Tag方法提升了5.2个百分点.

关键词：深度学习、图像分类、多标记学习、零样本学习、互学习

所属期刊栏目：49

分类号：TP18(自动化基础理论)

资助基金：国家自然科学基金;安徽省高校科学研究重点项目;安徽省高校科学研究重点项目;安徽省高校优秀青年人才支持计划项目

在线出版日期：2023-10-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：64-71

英文信息展示

期刊专题