10.3969/j.issn.1001-5795.2009.06.003
应用随机特征码检测雷同译文
试卷自动评分研究中有个十分重要却常被忽略的环节--对于雷同内容的自动检测.翻译考试的雷同译文与一般的重复文档有着不同的特点.通过对比各种文档相似算法,最终选择了特征码的方法用于检测汉译英雷同译文,并结合翻译考试的特点,提出了随机特征码的方法,解决了特征码选取位置难以确定的问题,同时降低了特征码对于编辑差异的敏感度,提高了雷同内容检测的查准率和查全率.该算法的复杂度为线性,适用于大规模翻译试卷的快速检查.
自动评分、雷同内容检测、文本相似度、特征码
H319.3(英语)
教育部基地2007年度项目:大规模考试主观题英汉互译自动评分系统的研制07JJD740070
2010-01-26(万方平台首次上网日期,不代表论文的发表时间)
共4页
14-17