10.3969/j.issn.1001-3695.2017.02.036
基于LDA和DBSCAN的软件多版本克隆群映射方法
针对克隆群映射大多基于相邻版本对比,当克隆群在中期版本短暂消失,实现多版本间映射存在困难,提出一种基于LDA和DBSCAN的软件多版本克隆群映射方法.首先,对所有版本的克隆群进行预处理,获得克隆群文档集合;其次,根据贝叶斯信息准则选取合适主题数T,进行主题概率模型训练,将所有克隆群都表示成T个主题的概率分布向量;再次,计算克隆群之间的JS距离,利用DBSCAN算法将同源的克隆群聚成一簇;最后,对同簇的克隆群按版本先后排序,得到多版本克隆群映射结果.对五款开源软件83个版本进行了映射实验,结果表明查全率、查准率均在98%以上,为克隆代码分析、管理提供了有力支持.
克隆群映射、软件演化、LDA、DBSCAN、克隆代码
34
TP311.54(计算技术、计算机技术)
国家自然科学基金资助项目61363017,61462071;内蒙古自然科学基金资助项目2014MS0613,2015MS0606;内蒙古自治区高等学校科学研究项目NJZY16045
2017-05-10(万方平台首次上网日期,不代表论文的发表时间)
共6页
481-486