10.16208/j.issn1000-7024.2023.09.009
基于样本分布的类别均衡化方法
为解决样本类别不均衡问题,提出基于样本分布的类别均衡化算法.采用单类支持向量机和近邻法学习多数类样本,净化类别不清的分布边界;采用密度聚簇算法对少数类样本聚簇,根据每个类簇的权重决定每个类簇生成的样本数,平衡类簇间的样本数量;根据每个簇的边界样本与非边界样本数量比值,确定每个样本权重,采用SMOTE合成少数类样本.采用UCI数据集实验对比和地震数据分析应用,验证了算法在不同分类模型均可提高分类精度.
不均衡数据、过采样、单类支持向量机、密度聚类、样本类别均衡化、样本分布、分类
44
TP306.1(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;中国石油大学北京克拉玛依校区科研启动基金;福建省自然科学基金项目;福建省自然科学基金项目
2023-11-02(万方平台首次上网日期,不代表论文的发表时间)
共8页
2626-2633