10.3969/j.issn.1003-0077.2011.03.003
面向人名消歧任务的人名识别系统
CLP2010(CIPS-SIGHAN Joint Conference on Chinese Language Processing)的人名消歧评测的任务是个 聚类问题:对给定的一组文档,按照文档中出现的指定查询词所指向的人进行聚类.由于是用"字"串匹配的方法从新华社的语料库中抽出所有含有该查询词的文档.所以对于这个任务,首要问题是判定查询词是否是人名,是完整人名还是人名的一部分.为此该文实现了一个基于多实体识别系统整合和启发式规则的后处理方法的人名识别系统,从而实现对文档中的人名,特别是查询词所涉及的人名的识别.在CLP2010的评测方给的训练集上的实验表明,查询词涉及的人名的识别正确率达到98.89%.
人名识别、人名消歧、系统整合、启发式规则
25
TP391(计算技术、计算机技术)
国家自然科学基金项目60873091,61073140;辽宁省自然科学基金项目20102063;中央高校基本科研业务费专项资金
2011-08-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
17-22