10.3778/j.issn.1002-8331.2102-0274
神经机器翻译面对句长敏感问题的研究
随着深度学习的发展神经网络机器翻译有了长足的进步.众所周知,神经机器翻译方法对句子长度比较敏感.为了充分利用海量平行语料,考虑平行语料句子长度信息,把原平行语料划分若干个模块,为每一个模块训练一个子模型,提出一种按句子长度融合策略的神经机器翻译方法.当训练结束时,通过句长边界划分后的模型融合与三特征(困惑度、句长比与分类器)融合排序方法得到译文.实验结果表明,提出的方法在三个不同测试集上英中任务中平均提高了1.2左右的BLEU点,维汉任务中提升了0.4至0.6的BLEU点.说明该方法具有一定的参考意义.
机器翻译、极端句长数据、困惑度、融合、深度学习
58
TP391.2;TP183(计算技术、计算机技术)
中国新疆维吾尔自治区重点实验室开放基金;中国新疆维吾尔自治区重点实验室开放基金;国家自然科学基金;国家自然科学基金;国家语委科研项目
2022-05-20(万方平台首次上网日期,不代表论文的发表时间)
共6页
195-200