10.3969/j.issn.1007-130X.2017.12.013
一种扩展Winnowing剽窃检测算法
剽窃是目前学术界和教育界面临的普遍问题,成熟的商业化剽窃检测系统运行时间和经济代价高,不适合实时性、轻量级的学生作业等日常检测.对基于文本指纹的Winnowing剽窃检测算法进行扩展,在提取指纹的同时记录文本定位及其长度信息,给出了指纹提取、文本定位、剽窃指纹索引合并等算法,实现了剽窃文本的检测、定位、标记.实验结果及算法在应用系统中实际运行状况表明,算法的扩展对其性能影响不大,普通硬件配置条件下即可满足中小规模应用需求.扩展算法在原算法轻量级、高效率、可靠性和灵活度高等特点基础上,进一步拓展了Winnowing的功能,增强了原算法的适应性和应用价值.
Winnowing、剽窃检测、相似检测、剽窃文本定位、文本指纹
39
TP391.1(计算技术、计算机技术)
四川省教育厅自然科学项目15ZB0017
2018-01-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
2245-2251