10.3969/j.issn.1672-9722.2015.12.011
程序相似度检测算法
程序相似度检测对于发现程序剽窃和鉴定软件版权等都具有重要的应用价值。基于抽象语法树的程序相似度检测方法是一种典型的结构度量技术,但该方法通常采用预设的阈值,且对增加冗余代码的抄袭手段束手无策。针对上述问题,采用自适应阈值选取方式,并剪去语法树中影响判断的叶子节点,对基于抽象语法树的程序相似度检测算法进行了改进。同时,针对多个程序代码可能抄袭于同一源代码的问题,论文采用聚类方法,从程序集合中获得相似的程序子集。实验结果表明,改进后的算法能有效检测多种编程语言,且提高了程序相似度的检测效果。
相似度检测、语法树、自适应阈值、聚类方法
TP301(计算技术、计算机技术)
2016-03-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
2145-2149