DOI：10.3969/j.issn.1003-3254.2015.08.014

基于最大熵模型的冠词错误纠正系统

引用

摘要：

研究了英语语法中冠词错误的计算机自动纠正. 首先对冠词使用的错误进行定义分类, 并考虑到可能出现冠词缺失的情况, 通过采用基于最大熵模型的分类器, 选择包含上下文、上下文词性、短语结构等特征, 在训练集上进行模型预的训练, 然后使用模型对于输入句子进行预测并纠正存在的使用错误. 在NUCLE语料的实验中, 给出了语料处理、模型特点、训练语料的大小对于测试集效果的影响, 并且比较了自然语言处理中非常通用的朴素贝叶斯模型的结果, 还根据英语语法中存在的错误特点对模型进行改进, 最后在测试数据达到35.48%的F值,相较于CoNLL2013的shared task中最好结果有小幅提升.

关键词：冠词错误、计算机自动纠正、最大熵模型

所属期刊栏目：24

分类号：TP3;F27

在线出版日期：2015-10-09（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：85-90

英文信息展示

期刊专题