10.3321/j.issn:0469-5097.2006.02.005
一种基于级联模型的类别不平衡数据分类方法
真实世界问题中,不同类别的样本在数目上往往差别很大,而传统机器学习方法难以对小类样本进行正确分类,若小类的样本是足够重要的,就会带来较大的损失.因此,对类别分布不平衡数据的学习已成为机器学习目前面临的一个挑战.受计算机视觉中级联模型的启发,提出一种针对不平衡数据的分类方法BalanceCascade.该方法逐步缩小大类别使数据集趋于平衡,在此过程中训练得到的一系列分类器通过集成方式对预测样本进行分类.实验结果表明,该方法可以有效地提高在不平衡数据上的分类性能,尤其是在分类性能受数据的不平衡性严重影响的情况下.
机器学习、数据挖掘、类别不平衡、级联、集成学习
42
TP18(自动化基础理论)
国家杰出青年科学基金60325207;江苏省自然科学基金重点项目BK2004001;"973"国家计划2002CB312002
2008-05-12(万方平台首次上网日期,不代表论文的发表时间)
共8页
148-155