10.16157/j.issn.0258-7998.233887
融入翻译记忆库的法律领域神经机器翻译方法
面向法律领域的神经机器翻译对于合同文本翻译等应用场景具有重要价值.由于法律领域双语对齐语料稀缺,翻译效果还不理想.针对该问题,目前有效的方法是融入翻译记忆或翻译模版等外部信息,但法律领域的文本多具有固定的表达结构且用词准确规范,在翻译记忆库中同时利用翻译结构信息和语义信息能够进一步提升法律领域翻译性能.基于此,提出一种融入翻译记忆库的法律领域机器翻译方法.提出了一种新的法律领域翻译记忆库,首先基于语义和结构信息的相似性训练跨语言检索模型以充分利用单语数据,然后从翻译记忆库中检索与输入源句相关的一组翻译记忆和翻译模版,进而引导翻译模型生成目标句子.实验表明,在MHLAW数据集上,提出的方法可以使译文较基线模型提升1.28个BLEU点.
神经机器翻译、语义信息、结构信息、翻译记忆、翻译模版
49
TP391(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;国家自然科学基金;云南省重大科技专项;云南省重大科技专项;云南省重大科技专项;云南省高新技术产业专项
2023-09-28(万方平台首次上网日期,不代表论文的发表时间)
共7页
39-45