10.3969/j.issn.1003-0077.2013.02.013
基于篇章上下文的统计机器翻译方法
上下文信息对于统计机器翻译(Statistical Machine Translation,SMT)中的规则选择是很重要的,但是之前的SMT模型只利用了句子内部的上下文信息,没有利用到整个篇章的上下文信息.该文提出了一种利用篇章上下文信息的方法来提高规则选择的准确性,从而提高翻译的质量.首先利用向量空间模型获得训练语料的文档和测试集中文档的相似度,然后把相似度作为一个新的特征加入到短语模型中.实验结果表明,在英语到汉语的翻译工作中,该方法可以显著提高翻译质量.在NIST-08和CWMT-08两个测试集上BLEU值都有显著的提高.
统计机器翻译、上下文信息、向量空间模型
27
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61202216;国家863计划资助项目2011AA01A207
2013-06-07(万方平台首次上网日期,不代表论文的发表时间)
共5页
86-90