用于多模态语义分析的嵌入共识自动编码器

引用

摘要：

跨模态检索技术是一项近年来的研究热点.多模态数据具有异质性,而不同形式的信息之间又有着相似性.传统的单模态方法只能以一种方式重构原始数据,并未考虑到不同数据之间的语义相似性,不能进行有效的检索.因此,文中建立了一个跨模态嵌入共识自动编码器(Cross-Modal Semantic Autoencoder with Embedding Consensus,ECA-CMSA),将原始数据映射到低维共识空间以保留语义信息,学习出对应的语义代码向量,并引入参数来实现去噪.然后,考虑到各模态之间的相似性,采用自动编码器将特征投影关联到语义代码向量.此外,对低维矩阵进行正则化稀疏约束,以平衡重构误差.在4个多模态数据集上验证所提方法的性能,实验结果证明其查询结果有所提升,实现了有效的跨模态检索.进一步,ECA-CMSA还可以应用于与计算机和网络有关的领域,如深度学习和子空间学习.该模型突破了传统方法中的障碍,创新地使用深度学习方法将多模态数据转换为抽象的表达,使其可以获得更好的准确度和识别结果.

关键词：多模态检索;嵌入共识;自动编码器;稀疏正则

所属期刊栏目：48

分类号：TP39(计算技术、计算机技术)

资助基金：科技创新 2030-"新一代人工智能"重大项目;国家自然科学基金;民机项目

在线出版日期：2021-08-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：93-98

英文信息展示

期刊专题