DOI：10.3969/j.issn.1006-4710.2015.03.005

特定句法增强的SMT调序模型

引用

摘要：

面向基于短语的汉英统计机器翻译，提出了一种基于特定句法（汉语“的”结构）增强的调序方法，该方法首先在词对齐和源端词性（POS）信息的约束下抽取基本调序规则，然后根据中文端特定句法结构—“的”字结构，将抽取的基本规则自动分类为“调序倾向性强”和“调序倾向性弱”两类，最后采用不同的优化和剪枝策略对两类规则进行处理，得到最终的源语言端调序规则集合。在NIST汉英数据集上的实验表明，相对于基线系统，本文所提方法在 NIST MT2005测试集上显著提高了0．69 BLEU值。

关键词：统计机器翻译、特定句法结构、“的”结构、POS调序模型

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目61100085。

在线出版日期：2015-11-09（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：277-281

英文信息展示

期刊专题