10.3969/j.issn.1674-3067.2014.02.010
基于统计机器翻译技术的胡都木—托忒文本转写的实现
针对蒙文多文种文本(如传统蒙文TM,新蒙文NM及托忒文Todo)的互换显示需求,本文研究了基于短语的统计机器翻译技术的自动转写方法.首先,人工建立上述三文平行6万条句对语料.其次,利用TM和Todo(NM)双文句对中,词间空格信息对,TM功能词与前词强制连接,生成双文句及词对齐语料,并生成统计翻译模型和语言模型.最后,借助于Moses解码器实现双文的自动转写.实验分别用300开发句和测试句进行TM-Todo句文双向互译时,其BLEU值分别达到了57.82%和58.03%,比先前汉-蒙语机器翻译最好BLEU值:29.86%,近高一倍.
蒙文胡都木托忒文本、平行语料、统计机器翻译、Moses、余弦相似度
H2(中国少数民族语言)
新疆维吾尔自治区自然科学基金2012211A012
2014-08-21(万方平台首次上网日期,不代表论文的发表时间)
共10页
62-71