10.3772/j.issn.1000-0135.2009.06.010
基于本体的汉语领域命名实体识别
命名实体识别是众多自然语言处理任务的核心内容之一,也是近年来的领域研究热点.本文将命名实体分为两大类:常规命名实体和领域命名实体.基于已经构建的领域本体MPO,本文提出一种基于本体知识规则与统计方法相结合的领域命名实体识别方法.该方法通过本体化实例,获取实体构成词性规则模板,结合CRFs机器学习模型,进行领域命名实体识别.实验结果表明:相比运用单一统计方法而言,该方法能使领域实体的识别性能显著提高,F值达到92.36%.同时表明本体化知识规则的有效运用,能够在领域实体边界和特殊形式领域实体识别的准确率上发挥积极作用.
领域实体、领域命名实体识别、本体、词性规则模板、CRFs
28
TP1;TP3
基金项目:本文得到国家8632006AA01Z152,2006AA010109;国家自然科学基金60672149
2009-12-22(万方平台首次上网日期,不代表论文的发表时间)
共7页
857-863