10.3969/j.issn.1672-9722.2021.11.025
基于谱聚类的不平衡数据欠采样方法研究
不平衡数据的分类问题在数据挖掘和机器学习领域中,一直是备受关注的问题.论文从数据预处理方面出发,提出一种基于谱聚类的欠采样方法,以此来降低数据的不平衡程度.先对多类样本进行谱聚类,根据每个聚类簇的密集程度,以及到少类样本的平均距离,来计算每个聚类簇的采样数目和选取怎样的多类样本,此欠采样方法可以有效去除多数类的冗余数据.实验结果证明,该算法可以有效提升少类样本的分类效果.
不平衡数据;谱聚类;欠采样;支持向量机
49
P413(大气探测(气象观测))
2021-12-06(万方平台首次上网日期,不代表论文的发表时间)
共6页
2305-2309,2330