DOI：10.3969/j.issn.1000-0135.2002.03.003

基于EM算法的汉语自动分词方法

引用

摘要：

汉语自动分词是中文信息处理中的基础课题.本文首先对汉语分词的基本概念与应用,以及汉语分词的基本方法进行了概述.接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型,并重点剖析了EM(Expectation-Maximization)算法,对实验结果进行了分析.最后对算法进行了总结与讨论.

关键词：分词、汉语、EM算法、语料库、HMM

所属期刊栏目：21

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金69975024;国家自然科学基金69931040

在线出版日期：2004-01-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：269-272

英文信息展示

期刊专题