10.3969/j.issn.1003-3254.2015.08.014
基于最大熵模型的冠词错误纠正系统
研究了英语语法中冠词错误的计算机自动纠正. 首先对冠词使用的错误进行定义分类, 并考虑到可能出现冠词缺失的情况, 通过采用基于最大熵模型的分类器, 选择包含上下文、上下文词性、短语结构等特征, 在训练集上进行模型预的训练, 然后使用模型对于输入句子进行预测并纠正存在的使用错误. 在NUCLE语料的实验中, 给出了语料处理、模型特点、训练语料的大小对于测试集效果的影响, 并且比较了自然语言处理中非常通用的朴素贝叶斯模型的结果, 还根据英语语法中存在的错误特点对模型进行改进, 最后在测试数据达到35.48%的F值,相较于CoNLL2013的shared task中最好结果有小幅提升.
冠词错误、计算机自动纠正、最大熵模型
24
TP3;F27
2015-10-09(万方平台首次上网日期,不代表论文的发表时间)
共6页
85-90