10.3969/j.issn.1000-3428.2011.15.038
一种改进的不平衡数据集分类方法
传统的机器学习方法在解决不平衡分类间题时,得到的分类器具有很大的偏向性,表现为少数类识别率远低于多数类.为此,在旋转森林分类方法的基础上,提出一种改进的不平衡数据处理方法--偏转森林.通过对少数类进行过抽样改变训练数据的分布以减小数据的不平衡,采用随机抽取的方式确保生成偏转矩阵的样本间存在差异,从而提高集成分类器的分类精度.实验结果表明,该方法能取得较好的分类性能,具有较高的少数类识别正确率和较低的多数类识别错误率.
不平衡数据集、偏转森林、集成分类器、过抽样
37
TP393(计算技术、计算机技术)
国家自然科学基金资助项目50705069,50905013,50934007;高等学校博士学科点专项科研基金资助项目20090006120007;中央高校基本科研业务费专项基金资助项目FRF-TP-09-014A
2012-01-07(万方平台首次上网日期,不代表论文的发表时间)
共3页
122-124