10.3969/j.issn.1002-137X.2009.10.048
统计机器翻译中的非连续短语模板抽取及其应用
目前基于短语的统计机器翻译模型很少将非连续短语的情况考虑在内,由此造成翻译结果在目标语言中的意义变化或缺失.以非连续介词短语为例,提供了一种短语模板抽取算法.首先采用基于规则的方法,抽取出中文非连续介词短语模板,而后借助双语对齐语料和介词_方位词翻译表,获得模板对应的英文翻译.最终形成的双语模板被加入短语翻译表中.在标准测试语料上的对比实验表明,加入非连续短语模板后,译文更加符合语法规范,而翻译结果也取得了相对稳定的提高.
统计机器翻译、短语模板、非连续介词短语、模板抽取
36
TP391(计算技术、计算机技术)
国家自然科学基金项目60603027;微软亚洲研究院
2009-12-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
192-196