10.20009/j.cnki.21-1106/TP.2020-1084
融入语言差异化特征的汉越神经机器翻译译文质量估计
译文质量估计是机器翻译领域中一个重要的子任务,该任务旨在不依靠参考译文的情况下对机器译文进行质量分析.当前,译文质量估计任务在汉英、英德机器翻译上有较好的表现,技术相对成熟.但是将模型应用到汉-越神经机器翻译中面临较多问题.尤其是译文质量估计模型在汉越平行数据中提取到的语言特征不能够充分地体现汉语与越南语之间的语言特点,加之汉语与越南语之间语序与句法结构也存在明显的差异.针对上述问题,本文采用统计对齐的方法对汉越之间结构差异进行建模,提取汉语与越南语之间的语言差异化特征,以提升汉越译文质量估计的效果.实验结果表明,融入语言差异化特征在汉-越和越-汉两个方向上较基线模型分别提升了0.52个百分点和0.35个百分点.
质量估计、汉越平行数据、语言特点、差异化特征、汉-越神经机器翻译
43
TP391(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家重点研发计划;国家重点研发计划;国家重点研发计划;云南省重大科技专项计划项目;云南省人培项目
2022-07-13(万方平台首次上网日期,不代表论文的发表时间)
共6页
1413-1418