10.3969/j.issn.1000-3428.2010.04.006
中文分词和词性标注模型
构造一种中文分词和词性标注的模型,在分词阶段确定N个最佳结果作为候选集,通过未登录词识别和词性标注,从候选结果集中选优得到最终结果,并基于该模型实现一个中文自动分词和词性自动标注的中文词法分析器.经不同大小训练集下的测试证明,该分析器的分词准确率和词性标注准确率分别达到98.34%和96.07%,证明了该方法的有效性.
分词、词性标注、最短路径
36
TP18(自动化基础理论)
国家"863"计划基金资助项目"智能感知与先进计算技术"2007AA01Z160;北京市自然科学基金资助重点项目"基于情绪认知模型的个性化数字教育关键技术研究"KZ200810028016
2010-04-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
17-19