10.13682/j.issn.2095-6533.2014.04.014
基于异构知识库的命名实体消歧
针对自然语言处理中的中文命名实体消歧问题,提出一种基于异构知识库的层次聚类方法。利用中文信息抽取系统对中文维基百科等知识库进行抽取,形成包含人物信息、实体关系的实体信息对象,并在 Hadoop 平台上用分布式计算进行层次聚类,研究人物实体特征的选取和维基百科等知识库的使用对命名实体消歧结果的影响。结果表明加入百科知识库后,F值从91.33%增加到了92.68%。
人名消歧、维基百科、中文信息抽取、层次聚类、实体信息
TP391.1(计算技术、计算机技术)
陕西省教育厅科研计划自然基金资助项目12JK0938
2014-07-23(万方平台首次上网日期,不代表论文的发表时间)
共7页
70-76