10.3772/j.issn.1000-0135.2022.01.007
基于无监督图神经网络的学术文献表示学习研究
学术文献特征表示,是学术文献搜索、分类组织、个性化推荐等学术大数据服务的关键步骤.研究表明,图神经网络能够有效学习文献的特征表示,然而当前研究主要集中在有监督学习方法上,不仅对数据集的大小和质量的要求较高,且学习到的文献特征表示与具体任务高度耦合.基于此,本文将四种无监督图神经网络方法引入学术文献表示学习,从Cora、CiteSeer和DBLP(database systems and logic programming)数据集的引文网络、共被引网络和文献耦合网络中学习文献的表示向量,并应用于文献分类和论文推荐两大下游任务.研究结果表明,①深度互信息图神经网络适合于文献分类任务,对抗正则化变分图自编码器则在论文推荐任务上性能更佳;②Cora数据集上的结果表明,相较于共被引和文献耦合网络,引文网络更适合于学习通用的文献表示向量.
无监督学习、图神经网络、表示学习、学术文献
41
国家自然科学基金;中国博士后科学基金
2022-02-16(万方平台首次上网日期,不代表论文的发表时间)
共11页
62-72