DOI：10.3969/j.issn.1003-0077.2009.06.015

汉蒙翻译模型中的依存语法与形态信息应用研究

引用

摘要：

该文提出将源语言句法信息和目标语言形态信息引入汉蒙机器翻译的模型构造中,以降低译文的词形错误率等问题.在源语言端,利用汉语依存句法分析器获取依存树,将依存句法信息以标注形式记在每个词上;在目标语言端,分析并获取蒙古语形态信息;利用LOP思想将源语言依存句法信息和目标语言形态信息引入翻译模型构造中.实验表明,其BLEU评分比传统的短语统计翻译模型有明显提高.该方法通过词、短语、句法三层面信息的结合,实现了汉蒙两种语言语法结构的平衡,特别适合于源语言形态信息贫乏而目标语言形态信息丰富的统计机器翻译系统.

关键词：人工智能、机器翻译、依存语法、形态信息、汉蒙翻译模型、LOP-Factored模型、统计机器翻译

所属期刊栏目：23

分类号：TP391(计算技术、计算机技术)

资助基金：中国科学院知识创新工程重要方向资助项目KGCX2-SW-511

在线出版日期：2010-01-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：98-104

英文信息展示

期刊专题