基于商空间理论的非平衡数据集分类算法
在机器学习及其分类问题时经常会遇到非平衡数据集,为了提高非平衡数据集分类的有效性,提出了基于商空间理论的过采样分类算法,即QMSVM算法.对训练集中多数类样本进行聚类结构划分,所得划分结果和少数类样本合并进行线性支持向量机(SVM)学习,从而获取多数类样本的支持向量和错分的样本粒;另一方面,获取少数类样本的支持向量和错分的样本,进行SMOTE采样,最后把上述得到的两类样本合并进行SVM学习,这样来实现学习数据集的再平衡处理,从而得到更加合理的分类超平面.实验结果表明,和其他几种算法相比,所提算法虽在正确分类率上有所降低,但较大改善了g_means值和acc+值,且对非平衡率较大的数据集效果会更好.
非平衡数据集、商空间理论、支持向量机、过采样、QMSVM算法
32
TP311.13(计算技术、计算机技术)
国家自然科学基金资助项目71071002;安徽省教育厅自然科学基金资助项目05010428;安徽大学人才队伍建设项目;安徽大学学术创新团队项目KJTD001B
2012-04-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
210-212