机器翻译词语漏译的语料库语境策略研究
机器翻译漏译错误有语用、语法层面的,也有词语层面的,后者占比较大.本文从机器翻译译后和机器翻译应用两个角度总结漏译的语言学应对策略.从词、短语和句子三个层级入手,采用本地语料库和机器翻译数据的语境交叉确认策略确定漏译的词语,采用词向量语境关联搭配策略降低机器翻译漏译数量.在两项实验中,与词语漏译评测强相关的BLEU值以及人工评测的结果都显示,在语言学干预语料库因素和词向量语境因素后,漏译比例大幅减少,相关词语错译和语序错误也同步减少.
机器翻译、漏译、语料库、语境
54
H059(写作学与修辞学)
教育部人文社会科学研究项目;福建省社会科学规划项目
2022-05-06(万方平台首次上网日期,不代表论文的发表时间)
共11页
277-287