10.3969/j.issn.1000-3428.2014.06.034
一种面向不平衡数据分类的组合剪枝方法
传统的数据分类算法多是基于平衡的数据集创建,对不平衡数据分类时性能下降,而实践表明组合选择能有效提高算法在不平衡数据集上的分类性能.为此,从组合选择的角度考虑不平衡类学习问题,提出一种新的组合剪枝方法,用于提升组合分类器在不平衡数据上的分类性能.使用Bagging建立分类器库,直接用正类(少数类)实例作为剪枝集,并通过MBM指标和剪枝集,从分类器库中选择一个最优或次优子组合分类器作为目标分类器,用于预测待分类实例.在12个UCI数据集上的实验结果表明,与EasyEnsemble、Bagging和C4.5算法相比,该方法不但能大幅提升组合分类器在正类上的召回率,而且还能提升总体准确率.
不平衡数据集、组合剪枝、剪枝集、评估指标、基分类器
40
TP18(自动化基础理论)
2014-08-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
157-161,165