10.3969/j.issn.1001-4616.2022.01.016
一种跨项目缺陷预测的源项目训练数据选择方法
跨项目软件缺陷预测(cross project defect prediction,CPDP)旨在实际的软件开发场景中,需要进行缺陷预测的目标项目可能是一个新启动项目,或这个项目已有的训练数据较为稀缺,需要利用其他项目已经搜集的训练数据来构建缺陷预测模型,其已经成为软件质量保证的一种手段,吸引了国内外研究人员的关注.然而,面对不同的目标项目,训练数据的选择将直接影响预测模型的性能.为了解决这个问题,本文描述了一种基于JS散度(Jensen-Shannon divergence)和相对密度的跨项目软件缺陷预测方法.该方法首先通过将源项目和目标项目分别拟合高斯混合模型(Gaussian mixture model,GMM),再通过蒙特卡洛方法计算出目标项目和所有候选项目之间的JS散度.其次,根据获得的JS散度选取与目标项目最接近的源项目;再次,提出相对密度概念,对选取的源项目训练数据进行有效选择.最后,利用CPDP中常用分类器构建预测模型.通过实验对比表明,本文方法不仅能够提高跨项目缺陷预测模型的性能,同时对不同分类器表现出较高的适应性.
跨项目,缺陷预测,软件质量,数据选择,JS;散度,相对密度,混合高斯模型,蒙特卡洛
45
TP311.5(计算技术、计算机技术)
江苏省自然科学面上基金项目;江苏省高校面上基金;江苏省镇江市社会发展重点研发项目;江苏科技大学高层次人才启动项目
2022-03-18(万方平台首次上网日期,不代表论文的发表时间)
共8页
110-117