DOI：10.16451/j.cnki.issn1003-6059.202203001

基于多模态图和对抗哈希注意力网络的跨媒体细粒度表示学习

引用

摘要：

跨媒体数据搜索中不同媒体类型的数据间存在特征异构和语义鸿沟问题,且社交网络数据往往呈现语义稀疏性、多样性等特性.针对上述问题,文中提出基于多模态图和对抗哈希注意力网络的跨媒体细粒度表示学习模型,获取统一的跨媒体语义表示,应用于社交网络跨媒体搜索.首先,构建图像-单词关联图,并基于图随机游走策略挖掘图像和文本单词间直接语义关联和隐含语义关联,实现语义关系扩展.然后,构建基于跨媒体协同注意力机制的跨媒体细粒度特征学习网络,通过互相指导的跨媒体注意力机制协同学习图像和文本的细粒度语义关联.最后,构建跨媒体对抗哈希网络,联合跨媒体细粒度语义关联学习和对抗哈希学习,获取高效紧凑的跨媒体统一哈希语义表示.实验表明,文中模型在两个公开标准跨媒体数据集上均取得较优的跨媒体搜索性能.

关键词：跨媒体表示学习、对抗哈希注意力网络、细粒度表示学习、跨媒体协同注意力机制、跨媒体搜索

所属期刊栏目：35

分类号：TP391(计算技术、计算机技术)

资助基金：国家重点研发计划;国家自然科学基金

在线出版日期：2022-04-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共12页

页码：195-206

英文信息展示

期刊专题