10.3969/j.issn.1000-7024.2007.23.036
不平衡数据集中的组合分类算法
为提高少数类的分类性能,对基于数据预处理的组合分类器算法进行了研究.利用Tomek links对数据集进行预处理;把新数据集里的多数类样本按照不平衡比拆分为多个子集,每个子集和少数类样本合并成新子集;用最小二乘支持向量机对每个新子集进行训练,把训练后的各个子分类器组合为一个分类系统,新的测试样本的类别将由这个分类系统投票表决.数据试验结果表明,该算法在多数类和少数类的分类性能方面,都优于最小二乘支持向量机过抽样方法和欠抽样方法.
不平衡数据集、最小二乘支持向量机、组合分类器、数据预处理、不平衡比
28
TP181(自动化基础理论)
国家自然科学基金10471045;广东省自然科学基金04020079;华南理工大学自然科学基金B13-E5050190
2008-04-07(万方平台首次上网日期,不代表论文的发表时间)
共4页
5687-5689,5761