10.3969/j.issn.1002-137X.2007.09.046
中文分词及词性标注一体化模型研究
本文应用N-最短路径法,构造了一种中文自动分词和词性自动标注一体化处理的模型,在分词阶段召回N个最佳结果作为候选集,最终的结果会在未登录词识别和词性标注之后,从这N个最有潜力的候选结果中选优得到,并基于该模型实现了一个中文自动分词和词性自动标注一体化处理的中文词法分析器.初步的开放测试证明,该分析器的分词准确率和词性标注准确率分别达到98.1%和95.07%.
中文分词、词性标注、N-最短路径法
34
TP3(计算技术、计算机技术)
山东省科技发展基金2002-276-022090104
2007-11-19(万方平台首次上网日期,不代表论文的发表时间)
共3页
174-175,212