基于最大熵的哈萨克语词性标注模型

引用

摘要：

最大熵模型能够充分利用上下文,灵活取用多个特征.使用最大熵模型进行哈萨克语的词性标注,根据哈语的粘着性、形态丰富等特点设计特征模板,并加入了向后依赖词性的特征模板.对模型进行了改进,在解码中取概率最大的前n个词性分别加入下一个词的特征向量中,以此类推直至句子结束,最终选出一条概率最优的词性标注序列.实验结果表明,特征模板的选择是正确的,改进模型的准确率达到了96.8％.

关键词：自然语言处理、词性标注、最大熵模型、哈萨克语

所属期刊栏目：49

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金61063025

在线出版日期：2013-07-15（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：126-129,165

英文信息展示

期刊专题