10.16208/j.issn1000-7024.2019.04.045
基于短语汉维机器翻译解码的研究及实现
针对汉、维翻译中维语形态变化复杂、汉维语句法结构不同等造成的解码局限性问题,将解码中语言模型的评分调整为重点考虑短语衔接处的单词串的得分,引入词向量进行短语相似度计算,利用词向量将单词间隐含的语义关系加入到解码评分;调整解码的调序距离限制方法,设计一个限制解码中短语扩展的方法,使解码的调序更符合汉维翻译的实际;在此基础上,按优化的方案实现解码器.实验结果表明,优化能使译文BLEU值在基线方案基础上提升3.46,最终方案解码器的译文BLEU值为29.18.
汉维统计机器翻译、解码、特征模型、语言模型、调序限制、柱搜索
40
TP391.1(计算技术、计算机技术)
新疆自治区重点实验室开放课题基金项目2015KL031;新疆自治区重大科技专项课题基金项目2016A03007-3;新疆维吾尔自治区自然科学基金项目2015211B034;中国科学院青年创新促进会基金项目2017472
2019-06-27(万方平台首次上网日期,不代表论文的发表时间)
共7页
1183-1189