10.11896/j.issn.1002-137X.2019.01.037
基于双语主题模型和双语词向量的跨语言知识链接
跨语言知识链接是指在描述相同内容的不同语言的在线百科文章之间建立联系.跨语言知识链接可分为候选集选择和候选集排序两部分.首先,把候选集选择问题转换为跨语言信息检索问题,提出一种将标题与关键词相结合从而生成查询的方法,该方法将候选集选择的召回率大幅提高至93.8%;在候选集排序部分,提出一种融合双语主题模型及双语词向量的排序模型,实现了英文维基百科和中文百度百科之间军事领域的跨语言知识链接.实验结果表明,该模型取得了75% 的准确率,显著提高了跨语言知识链接的性能,并且提出的方法不依赖于语言特性和领域特性,因此可以很容易地扩展至其他语言和其他领域的跨语言知识链接.
跨语言知识链接、跨语言信息检索、双语主题模型、双语词向量
46
TP391(计算技术、计算机技术)
2019-03-15(万方平台首次上网日期,不代表论文的发表时间)
共7页
238-244