基于双语对齐的汉语-新蒙古文命名实体翻译
汉语-新蒙古文命名实体翻译在跨汉语-新蒙古文信息处理中具有重要意义,而直接使用机器翻译的方法不能达到满意的结果.针对上述问题,提出一种从汉语-新蒙古文平行语料中自动抽取汉语-新蒙古文命名实体翻译对的方法.该方法只需对汉语端进行命名实体标注;然后基于双语HMM词对齐结果,利用滑动窗口的方法抽取所有候选命名实体翻译对;最后基于融合5种特征的最大熵模型,对所有候选翻译单位进行过滤,选取与汉语端命名实体相对应的置信度最高的新蒙古文命名实体翻译单位.实验结果表明,该方法优于基于HMM的方法,在对齐模型只是部分准确的情况下,也获得较高准确率的汉语-新蒙古文命名实体翻译对.
命名实体、识别、翻译、双语对齐
52
TP391(计算技术、计算机技术)
国家自然科学基金61362028
2017-01-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
148-154