10.3969/j.issn.1000-3428.2011.15.055
基于Viterbi改进算法的高棉语分词研究
采用最大匹配算法对高棉语进行分词准确率较低,且难以正确识别词库中没有的新词.针对该问题,采用改进的Viterbi算法,利用自动机实现音节切分,通过最优选择及剪枝操作提高分词效率,以统计语言模型对未知新词进行数据平滑,提高识别正确率.实验结果表明,改进的Viterbi算法具有较高的分词效率和准确率.
Viterbi算法、最大匹配算法、分词、高棉语、剪枝、统计语言模型
37
TP391(计算技术、计算机技术)
广东省自然科学基金资助项目8151009001000041
2012-01-07(万方平台首次上网日期,不代表论文的发表时间)
共3页
174-176