10.3969/j.issn.1673-4785.201209054
基于序列聚类的相似代码检测算法
为了提高源程序代码之间相似性的检测效率,提出一种基于序列聚类的相似代码检测算法.算法首先把源代码按照其自身的结构进行分段提取,然后对各个分段进行部分代码变换,再以带权重的编辑距离为相似度量标准对这些符号进行序列聚类,得到相似的程序代码片段,以达到对源程序进行相似功能检测的目的.使用多个真实和仿真程序对上述算法进行了实验,实验结果验证了算法的有效性和可伸缩性.
序列聚类、权重编辑距离、相似代码检测
8
TP311.131(计算技术、计算机技术)
国家自然科学基金资助项目61170190
2013-04-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
52-57