10.3969/j.issn.1000-1220.2021.10.030
一种改进的半监督集成软件缺陷预测方法
针对半监督软件缺陷预测中的类不平衡以及特征中含有过多无关特征和冗余特征的问题,提出一种改进的半监督集成软件缺陷预测方法FeSSTri(semi-supervised software prediction using Feature Selecting and Sample and Tri-training).首先使用ADASYN自适应综合过采样算法对部分标记样本进行采样,来解决数据集类不平衡问题;其次利用采样后的数据构建分类器,给未标记数据做预标记,将标记样本与预标记样本结合,使用最小冗余最大相关mRMR算法对数据集进行特征选择,解决无关特征过多和特征冗余问题,最后使用半监督集成算法Tri-training构建最终的半监督缺陷预测模型.本文在NASA数据集和AEEEM数据集上以F1值为评测指标对提出的模型进行了验证.实验结果表明:FeSSTri方法要优于初始的Tri-training算法,并且与经典的机器学习方法相比,FeSSTri方法均可以取得更好的预测结果.
软件缺陷预测;类不平衡;特征选择;半监督预测;机器学习
42
TP311(计算技术、计算机技术)
黑龙江省自然科学基金项目;哈尔滨师范大学计算机学院科研项目;哈尔滨师范大学研究生创新科研项目
2021-10-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
2196-2202