基于伪数据的机器翻译质量估计模型的训练

引用

摘要：

为向基于深度学习的机器翻译质量估计模型提供高效的训练数据, 提出面向目标数据集的伪数据构造方法, 采用基于伪数据预训练与模型精调相结合的两阶段模型训练方法对模型进行训练, 并针对不同伪数据规模设计实验.结果表明, 在构造得到的伪数据下, 利用两阶段训练方法训练得到的机器翻译质量估计模型给出的得分与人工评分的相关性有显著的提升.

关键词：机器翻译质量估计、深度学习、伪数据

所属期刊栏目：54

分类号：TP391(计算技术、计算机技术)

资助基金：国家高技术研究发展计划2015AA015405;国家自然科学基金61370170,61402134

在线出版日期：2018-05-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：279-285

英文信息展示

期刊专题