基于谱聚类和成对数据表示的多层感知机分类算法
面向类别不均衡数据集的分类学习一直是数据挖掘和机器学习领域的研究热点.数据级、算法级和集成方法是目前解决类别不均衡学习的3种主流方法,其中欠抽样是类别不均衡学习一种常用的数据级解决方法,其缺点在于容易丢失多数类中部分有用信息.文中将谱聚类引入到成对数据表示的多数类欠抽样过程中,首先利用谱聚类方法,对多数类样本进行聚类,根据聚类簇大小和簇内样本点与少数类样本点的平均距离,在每个聚类簇内抽取不同个数有代表性的样本,并将簇内样本点之间及所有少数类样本点两两成对表示,从而有效降低了所有样本成对数据表示中两两组合而导致的数据暴涨问题,同时避免了随机抽样而可能导致的有效信息丢失问题.最后在9组UCI数据集上验证了所提算法的有效性.
多层感知机、分类、欠抽样、谱聚类、不均衡学习
46
TP311(计算技术、计算机技术)
国家自然科学基金项目61602518,71872180;中南财经政法大学中央高校基本科研业务费专项资金2722019JCG074,2722019JCT035
2019-12-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
194-198