DOI：10.3969/j.issn.1004-731X.2002.05.002

一种基于概率模型的分词系统

引用

摘要：

汉语自动分词是中文信息处理中的基础课题.本文首先对汉语分词的基本概念与应用,以及汉语分词的基本方法进行了概述.接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型,并重点剖析了EM(Expectation- Maximization)算法,最后给出了一个基于本模型的汉语文本处理仿真系统.

关键词：分词、EM算法、语料库、HMM、系统仿真

所属期刊栏目：14

分类号：TP18(自动化基础理论)

资助基金：国家自然科学基金;国家自然科学基金

在线出版日期：2004-01-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：544-546,550

英文信息展示

期刊专题