10.3969/j.issn.1673-629X.2021.08.021
基于近义词扩充的非通用语翻译评估
BLEU算法在用于非通用语翻译质量评估计算时,由于使用范围以及语料采集渠道的局限性等原因,导致难以获得足够规模的高质量非通用语语料作为参考译文,因而会造成在面对同一语义不同表述时BLEU误判低分.为此,该文采用预先对参考译文进行近义词分析提取的方法,扩展生成多参考译文,尽可能覆盖多种翻译的表达.同时设置阈值对提取出的近义词进行筛选,排除低质量近义词,避免因为扩展带来参考译文质量下降,再基于该扩充译文完成非通用语的质量评估.在实验中,以泰语为例,采用GloVe和Word2vec模型分别对语料库进行训练和近义词提取、参考译文扩充和BLEU评估.实验结果表明:在面对非通用语等参考语料不足的质量评估时,采用该方法可有效地提高评估的准确度,降低误判率.
非通用语;翻译评估;近义词扩展;BLEU算法;GloVe模型
31
TP39(计算技术、计算机技术)
国家自然科学基金;云南省创新团队;云南大学服务云南行动计划;云南省教育厅产业化项目
2021-09-06(万方平台首次上网日期,不代表论文的发表时间)
共5页
124-128