10.3969/j.issn.1002-137X.2002.07.033
语言信息处理技术中的最大熵模型方法
@@ 1引言
进行汉语处理时经常遇到的问题有:分词、词性标注、语法和语义分析等等.这些自然语言中的问题都可以形式化为分类问题,估计某一类y在上下文x中发生的概率,即p(y,x).在汉语中上下文x的内容可以包括汉字、词、词性等,对于不同的任务上下文的内容也不同.这类问题可以采用统计建模的方法去处理.
自然语言、信息处理技术、最大熵、模型方法、上下文、语义分析、统计建模、汉语处理、分类问题、词性标注、形式化、语法、汉字、概率、分词
29
TP39(计算技术、计算机技术)
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
108-110