10.3969/j.issn.1003-0077.2010.01.019
统计机器翻译中多分词结果的融合
汉英统计机器翻译中,汉语语料通常需要使用中文分词将句子切分成词序列.然而中文分词不是为统计机器翻译而开发的技术,它的分词结果不能保证对统计机器翻译的优化.近些年,一些研究试图改进中文分词方法从而达到对统计机器翻译的优化.在该文中,从另外的角度研究中文分词对统计机器翻译的影响.基本思想是利用多分词结果作为额外的语言知识,提出一种简单而有效的方法使这些知识为统计机器翻译所用,使用了一系列策略融合多分词结果,并将融合结果应用在统计机器翻译系统中.实验结果表明这种方法比没有使用多分词结果融合的系统提高1.89个BLEU分数.
人工智能、机器翻译、统计机器翻译、中文分词、翻译模型特征插值、多策略特征融合
24
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60736014;国家863计划资助项目2006AA010108
2010-04-06(万方平台首次上网日期,不代表论文的发表时间)
共6页
104-109