10.3969/j.issn.1003-0077.2022.12.011
基于预训练模型和图卷积网络的中文短文本实体链接
短文本实体链接由于缺乏主题信息,只能依靠局部短文本信息和知识库.现有方法主要通过计算局部短文本和候选实体之间的相似度完成候选实体集的排序,但并未显式地考虑局部短文本和候选实体在文本交互上的关联性.针对上述问题,该文提出短文本交互图(STIG)的概念和一个双步训练方案,利用BERT提取局部短文本和候选实体间的多粒度特征,并在短文本交互图上使用图卷积机制.此外,为了缓解均值池化使图卷积发生退化的问题,该文提出一个将交互图中各节点特征和边信息压缩成稠密向量的方法.在CCKS2020短文本实体链接数据集上的实验验证了所提方法的有效性.
实体链接、BERT、图卷积神经网络
36
TP391(计算技术、计算机技术)
国家自然科学基金;中国科学院“西部之光”人才培养引进计划;中国科学院青年创新促进会项目;自治区天山青年计划项目;新疆维吾尔自治区重大专项
2023-02-20(万方平台首次上网日期,不代表论文的发表时间)
共11页
104-114