10.3778/j.issn.1002-8331.1901-0083
基于边界混合重采样的非平衡数据分类方法
在非平衡数据分类问题中,为了合成有价值的新样本和删除无影响的原样本,提出一种基于边界混合重采样的非平衡数据分类算法.该算法首先引入支持k-离群度概念,找出数据集中的边界点集和非边界点集;利用改进的SMOTE算法将少数类中的边界点作为目标样本合成新的点集,同时对多数类中的非边界点采用基于距离的欠采样算法,以此达到类之间的平衡.通过实验结果对比表明了该算法在保证G-mean值较优的前提下,一定程度上提高了少数类的分类精度.
支持k-离群度、重采样、边界点、非平衡数据分类
56
TP181(自动化基础理论)
国家自然科学基金;陕西省自然科学基金
2020-01-17(万方平台首次上网日期,不代表论文的发表时间)
共7页
46-52