基于Transformer增强架构的中文语法纠错方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3969/j.issn.1003-0077.2020.06.014

基于Transformer增强架构的中文语法纠错方法

引用
语法纠错任务是自然语言处理领域的一项重要任务,近年来受到了学术界广泛关注.该任务旨在自动识别并纠正文本中所包含的语法、拼写以及语序错误等.该文将语法纠错任务看作是翻译任务,即将带有错误表达的文本翻译成正确的文本,采用基于多头注意力机制的Transformer模型作为纠错模型,并提出了一种动态残差结构,动态结合不同神经模块的输出来增强模型捕获语义信息的能力.受限于目前训练语料不足的情况,该文提出了一种数据增强方法,通过对单语语料的腐化从而生成更多的纠错数据,进一步提高模型的性能.实验结果表明,该文所提出的基于动态残差的模型增强以及腐化语料的数据增强方法对纠错性能有着较大的提升,在NLPCC 2018中文语法纠错共享评测数据上达到了最优性能.

语法纠错、多头注意力、动态残差结构、数据增强

34

TP391(计算技术、计算机技术)

北京语言大学语言资源高精尖创新中心项目;国家语委信息化项目

2020-07-23(万方平台首次上网日期,不代表论文的发表时间)

共9页

106-114

相关文献
评论
暂无封面信息
查看本期封面目录

中文信息学报

1003-0077

11-2325/N

34

2020,34(6)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn