10.3969/j.issn.1673-629X.2018.06.028
类不平衡稀疏重构度量学习软件缺陷预测
软件缺陷预测是提升软件质量的重要手段.为了改善缺陷预测性能,目前许多机器学习领域的最新成果已经引入到软件缺陷预测中.但是,软件缺陷预测数据通常存在类别分布不平衡的问题,这会影响预测效果.针对这个问题,提出了类不平衡稀疏重构距离度量学习软件缺陷预测方法.该方法首先在度量学习中加入代价敏感因素,学习距离度量特征矩阵并解决软件缺陷预测中分类错误代价不同的问题.其次,通过在目标函数中加入权重来进一步提高小类样本距离度量学习的准确性.最后,为了解决预测阶段数据集的类别不平衡问题,采用了改进加权KNN算法预测测试样本标签.在NASA软件缺陷预测标准数据集上的实验结果证明了该方法能提高召回率与F-measure值,改善分类性能.
软件缺陷预测、类不平衡、改进加权KNN、度量学习
28
TP31(计算技术、计算机技术)
国家自然科学基金61272273
2018-07-04(万方平台首次上网日期,不代表论文的发表时间)
共5页
125-128,136