10.3969/j.issn.1000-3428.2013.06.059
基于HMM的京剧机构命名实体识别寄法
针对机构命名实体识别效率低的问题,提出一种基于隐马尔科夫模型(HMM)的京剧机构命名实体识别寄法。利用 HMM模型标注文本切分结果的词性消除歧义,通过Viterbi寄法计寄某种分词结果所对应的可能性最大的词性序列。根据定制的名称识别规则,借助机构前缀词库、后缀词库获得机构名称左右边界,通过自动机寄法识别语料中的机构命名实体,并将新词加载到分词词典中。针对京剧领域语料进行开放测试验证,结果表明,该寄法的识别正确率可达到99%。
开放领域、命名实体识别、隐马尔科夫模型、Viterbi寄法、规则树
TP391(计算技术、计算机技术)
北京市优秀人才培养计划基金资助项目2012D002002000001;北京市职业院校教师素质提高工程基金
2013-10-24(万方平台首次上网日期,不代表论文的发表时间)
共7页
266-271,286