10.3969/j.issn.1002-0802.2022.08.004
基于依存距离惩罚的泰汉神经机器翻译方法
在"一带一路"倡议的背景下,泰国与我国的沟通日益密切,泰汉机器翻译具有很高的应用需求.作为低资源语言机器翻译,泰汉之间缺乏大规模、高质量的平行语料,导致翻译效果不佳.融入依存句法知识可以使译文更符合句法约束,弥补没有大规模平行语料的缺陷,但泰语缺少成熟的依存解析工具和依存标注训练集.针对以上问题,基于无监督迁移获取泰语依存句法结构知识,并提出依存距离惩罚机制以减少依存噪声对翻译性能的干扰,并通过基于依存感知注意力机制的Transformer架构将所提方法融入翻译.实验结果表明,该方法能有效提升泰汉神经机器翻译的效果.
泰语、依存距离惩罚、泰汉、神经机器翻译
55
TP391(计算技术、计算机技术)
国家自然科学基金61732005
2022-09-29(万方平台首次上网日期,不代表论文的发表时间)
共8页
990-997