10.3969/j.issn.1006-4710.2015.03.005
特定句法增强的SMT调序模型
面向基于短语的汉英统计机器翻译,提出了一种基于特定句法(汉语“的”结构)增强的调序方法,该方法首先在词对齐和源端词性(POS)信息的约束下抽取基本调序规则,然后根据中文端特定句法结构—“的”字结构,将抽取的基本规则自动分类为“调序倾向性强”和“调序倾向性弱”两类,最后采用不同的优化和剪枝策略对两类规则进行处理,得到最终的源语言端调序规则集合。在NIST汉英数据集上的实验表明,相对于基线系统,本文所提方法在 NIST MT2005测试集上显著提高了0.69 BLEU值。
统计机器翻译、特定句法结构、“的”结构、POS调序模型
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61100085。
2015-11-09(万方平台首次上网日期,不代表论文的发表时间)
共5页
277-281