10.16055/j.issn.1672-058X.2022.0001.005
基于图注意力网络的多标签图像分类模型
针对ML-GCN中标签共现嵌入维度过高影响模型分类性能和ML-GCN中没有充分发掘标签之间不对称关系的问题,提出一种基于图注意力网络的多标签图像分类模型ML-GAT;ML-GAT模型首先对高维标签语义嵌入矩阵进行降维;然后通过降维后的低维标签语义嵌入表示和标签类别共现图得到标签共现嵌入;与此同时ML-GAT将多标签原始图像输入卷积神经网络进行图像通用特征提取,将卷积神经网络提取出的多标签图像通用特征按照图注意力网络计算得到的标签共现嵌入的维度进行维度统一;最后ML-GAT融合标签共现嵌入和图像通用特征得到每一张多标签图像的标签预测评分;在VOC 2007与MS-COCO 2014上的实验结果表明:在训练样本充分且标签类别数足够多的情况下,ML-GAT取得了较好的实验结果,通过和其他模型比较分析,ML-GAT模型所采取的策略可以一定程度上提升模型的多标签图像分类性能.
多标签分类;图注意力网络;卷积神经网络;深度学习
39
TP181(自动化基础理论)
国家自然科学基金;安徽省高校自然科学研究重点项目;安徽省教育厅教学研究重点项目
2022-03-08(万方平台首次上网日期,不代表论文的发表时间)
共8页
34-41