10.3969/j.issn.1004-731X.2002.05.002
一种基于概率模型的分词系统
汉语自动分词是中文信息处理中的基础课题.本文首先对汉语分词的基本概念与应用,以及汉语分词的基本方法进行了概述.接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型,并重点剖析了EM(Expectation- Maximization)算法,最后给出了一个基于本模型的汉语文本处理仿真系统.
分词、EM算法、语料库、HMM、系统仿真
14
TP18(自动化基础理论)
国家自然科学基金;国家自然科学基金
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
544-546,550