10.19734/j.issn.1001-3695.2017.07.0699
面向不平衡分类的IDP-SMOTE重采样算法
传统的分类算法在对不平衡数据进行分类时,容易导致少数类被错分.为了提高少数类样本的分类准确度,提出了一种基于改进密度峰值聚类的采样算法IDP-SMOTE.首先,采用Box-Cox变换和σ准则对密度峰值聚类算法进行改进,实现了聚类中心和离群点的自动判别;然后,将改进的密度峰值聚类算法与SMOTE升采样算法相结合,去除噪声数据,并基于少数类样本的局部密度和邻近距离,在子类的范围内合成采样数据.该算法有效避免了升采样导致的边界模糊,改善了类内不平衡及边界样本难以学习的问题,同时实现了自动聚类和重采样,防止了人为因素干扰.通过实验对比,验证了提出算法的有效性和自适应性.
不平衡数据、分类、重采样、密度峰值聚类
36
TP311;TP301.6(计算技术、计算机技术)
2019-05-31(万方平台首次上网日期,不代表论文的发表时间)
共4页
115-118