语言信息处理技术中的最大熵模型方法

引用

摘要：

@@ 1引言进行汉语处理时经常遇到的问题有:分词、词性标注、语法和语义分析等等.这些自然语言中的问题都可以形式化为分类问题,估计某一类y在上下文x中发生的概率,即p(y,x).在汉语中上下文x的内容可以包括汉字、词、词性等,对于不同的任务上下文的内容也不同.这类问题可以采用统计建模的方法去处理.

机标关键词：自然语言、信息处理技术、最大熵、模型方法、上下文、语义分析、统计建模、汉语处理、分类问题、词性标注、形式化、语法、汉字、概率、分词

所属期刊栏目：29

分类号：TP39(计算技术、计算机技术)

在线出版日期：2004-01-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：108-110

英文信息展示

期刊专题