10.3772/j.issn.1000-0135.2019.01.008
多特征融合的中文命名实体链接方法研究
命名实体链接是利用知识库进行命名实体消歧,将文本中的实体指称映射至知识库中正确义项的一种方法.现有的命名实体链接研究与实践多利用维基百科实现西文实体的消歧,缺乏对中文命名实体消歧的研究.本文以百度百科作为基础知识库,提出了一种中文命名实体链接方法,该方法融合了单实体消歧和多实体消歧特征,并根据不同文本长度选用不同的特征组合,同时,在传统一阶段式消歧的基础上添加了第二阶段消歧以改善消歧结果.在真实中文语料上的实验表明,多特征叠加和两段式消歧可较大程度地提升消歧准确率.对比实验显示,本文提出的命名实体链接方法的总体性能优于当前主流同类系统的水平.
命名实体链接、命名实体消歧、多特征消歧、自然语言处理
38
国家社会科学基金重点项目"基于关联数据的学术文献内容语义发布及其应用研究"17ATQ001
2019-02-27(万方平台首次上网日期,不代表论文的发表时间)
共11页
68-78