10.19678/j.issn.1000-3428.0061316
代价敏感的Boosting软件缺陷预测方法
软件缺陷预测可以有效提高软件的可靠性,修复系统存在的漏洞.Boosting重抽样是解决软件缺陷预测样本数量不足问题的常用方法,但常规Boosting方法在处理领域类不平衡问题时效果不佳.为此,提出一种代价敏感的Boosting软件缺陷预测方法CSBst.针对缺陷模块漏报和误报代价不同的问题,利用代价敏感的Boosting方法更新样本权重,增大产生第一类错误的样本权重,使之大于无缺陷类样本权重与第二类错误样本的权重,从而提高模块的预测率.采用阈值移动方法对多个决策树基分类器的分类结果进行集成,以解决过拟合问题.在此基础上,通过分析给出模型构建过程中权重和阈值的最优化设置.在NASA软件缺陷预测数据集上进行实验,结果表明,在小样本的情况下,与CSBKNN、CSCE方法相比,CSBst方法的BAL预测指标分别提升7%和3%,且时间复杂度降低一个数量级.
软件缺陷预测;决策树;机器学习;阈值移动方法;Boosting方法
48
TP391(计算技术、计算机技术)
黑龙江省教育科学规划重点课题GJB1421251
2022-03-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
175-180