10.3969/j.issn.1003-0077.2019.03.006
面向神经机器翻译的集成学习方法分析
集成学习是一种联合多个学习器进行协同决策的机器学习方法,应用在机器翻译任务的推断过程中可以有效整合多个模型预测的概率分布,达到提升翻译系统准确性的目的.虽然该方法的有效性已在机器翻译评测中得到了广泛验证,但关于子模型的选择与融合的策略仍鲜有研究.该文主要针对机器翻译任务中的参数平均与模型融合两种集成学习方法进行大量的实验,分别从模型与数据层面、多样性与模型数量层面对集成学习的策略进行了深入探索.实验结果表明在WMT中英新闻任务上,所提模型相比Transformer单模型有3.19个BLEU值的提升.
集成学习、参数平均、模型融合、多样性
33
TP391(计算技术、计算机技术)
国家自然科学基金61876035 ,61732005 ,61562082;中央高校基本科研业务费;辽宁省高等学校创新人才支持计划
2019-04-29(万方平台首次上网日期,不代表论文的发表时间)
共10页
42-51