DOI：10.3969/j.issn.1673-629X.2021.08.021

基于近义词扩充的非通用语翻译评估

引用

摘要：

BLEU算法在用于非通用语翻译质量评估计算时,由于使用范围以及语料采集渠道的局限性等原因,导致难以获得足够规模的高质量非通用语语料作为参考译文,因而会造成在面对同一语义不同表述时BLEU误判低分.为此,该文采用预先对参考译文进行近义词分析提取的方法,扩展生成多参考译文,尽可能覆盖多种翻译的表达.同时设置阈值对提取出的近义词进行筛选,排除低质量近义词,避免因为扩展带来参考译文质量下降,再基于该扩充译文完成非通用语的质量评估.在实验中,以泰语为例,采用GloVe和Word2vec模型分别对语料库进行训练和近义词提取、参考译文扩充和BLEU评估.实验结果表明:在面对非通用语等参考语料不足的质量评估时,采用该方法可有效地提高评估的准确度,降低误判率.

关键词：非通用语;翻译评估;近义词扩展;BLEU算法;GloVe模型

所属期刊栏目：31

分类号：TP39(计算技术、计算机技术)

资助基金：国家自然科学基金;云南省创新团队;云南大学服务云南行动计划;云南省教育厅产业化项目

在线出版日期：2021-09-06（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：124-128

英文信息展示

期刊专题