10.3969/j.issn.1003-0077.2018.06.003
基于LSTM和N-gram的ESL文章的语法错误自动纠正方法
针对英语文章语法错误自动纠正(Grammatical Error Correction ,GEC)问题中的冠词和介词错误,该文提出一种基于LSTM (Long Short-Term Memory ,长短时记忆)的序列标注GEC方法;针对名词单复数错误、动词形式错误和主谓不一致错误,因其混淆集为开放集合,该文提出一种基于ESL (English as Second Lauguage)和新闻语料的N-gram投票策略的GEC方法.该文方法在2013年CoNLL的GEC数据上实验的整体F1值为33.87%,超过第一名UIUC的F1值31 .20%.其中,冠词错误纠正的 F1值为38 .05%,超过 UIUC冠词错误纠正的 F1值33.40%,介词错误的纠正F1为28.89%,超过UIUC的介词错误纠正F1值7 .22%.
语法错误自动纠正、LSTM、N-gram投票策略、ESL语料
32
TP391(计算技术、计算机技术)
2018-08-15(万方平台首次上网日期,不代表论文的发表时间)
共9页
19-27