10.3969/j.issn.1003-0077.2022.01.006
"细粒度英汉机器翻译错误分析语料库"的构建与思考
机器翻译错误分析旨在找出机器译文中存在的错误,包括错误类型、错误分布等,它在机器翻译研究和应用中发挥着重要作用.该文将人工译后编辑与错误分析结合起来,对译后编辑操作进行错误标注,采用 自动标注和人工标注相结合的方法,构建了一个细粒度英汉机器翻译错误分析语料库,其中每一个标注样本包括源语言句子、机器译文、人工参考译文、译后编辑译文、词错误率和错误类型标注;标注的错误类型包括增词、漏词、错词、词序错误、未译和命名实体翻译错误等.标注的一致性检验表明了标注的有效性;对标注语料的统计分析结果能有效地指导机器翻译系统的开发和人工译员的后编辑.
机器翻译、错误分析、错误标注、译后编辑
36
TP391(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;国家自然科学基金;国家社会科学基金;教育部人文社会科学研究项目
2022-05-07(万方平台首次上网日期,不代表论文的发表时间)
共9页
47-55