10.3969/j.issn.1673-629X.2011.05.003
样本大小对稀有类分类的影响
分类稀有类在现实生活中的很多领域都有广泛的应用,但普通的分类算法在分类稀有类时往往失效.探讨了影响稀有类分类的各个因素,针对影响稀有类中的一个因素,样本大小对稀有类的影响进行了研究.对于UCI学习库中的三个数据集,在weka平台上使用Roration Forest进行实验,对于相同的类比率,使用unsupervised resample数据预处理方法使样本由小变大.结果表明在特定的类比率下,使样本变大,由数据的不平衡分布造成的分类错误下降,普通的分类算法在分类稀有类时往往也可以取得很好的分类结果.
分类、稀有类、主成分分析、样本大小
21
TP311(计算技术、计算机技术)
河南省自然科学基金0211050100
2011-09-09(万方平台首次上网日期,不代表论文的发表时间)
共4页
9-12