10.3969/j.issn.1000-0135.2002.03.003
基于EM算法的汉语自动分词方法
汉语自动分词是中文信息处理中的基础课题.本文首先对汉语分词的基本概念与应用,以及汉语分词的基本方法进行了概述.接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型,并重点剖析了EM(Expectation-Maximization)算法,对实验结果进行了分析.最后对算法进行了总结与讨论.
分词、汉语、EM算法、语料库、HMM
21
TP391(计算技术、计算机技术)
国家自然科学基金69975024;国家自然科学基金69931040
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
269-272