10.16208/j.issn1000-7024.2019.11.013
基于密度峰值的Adaboost算法
针对不平衡数据分类问题,提出一种基于密度峰值的Adaboost算法.将训练数据划分为多数类和少数类,统计各自的数量;在多数类样本中,对由密度峰值算法快速聚类生成的各个簇按照采样率-ω进行随机欠采样,将所采样的多数类与原少数类合成新样本,降低数据的不平衡性;将合成样本带入以决策树为基分类器的自适应增强模型,通过改变样本权值分布提高该算法模型对于不平衡数据的分类性能.实验结果表明,该算法在评价指标ROC曲线下的面积(AUC)、G-mean和balance方面优于或者部分优于其它对比算法.
密度峰值、不平衡多分类、Adaboost、基分类器、决策树算法
40
TP301;TP399(计算技术、计算机技术)
国家自然科学基金项目61373064、61402236;江苏省“六大人才高峰”基金项目2015-DZXX-015;江苏省“六大人才高峰”创新团队基金项目TD-XYDXX-004;赛尔网络下一代互联网技术创新基金项目NGII20170610、NGII20171204;江苏省农业气象重点实验室开放基金项目KYQ1309
2020-01-07(万方平台首次上网日期,不代表论文的发表时间)
共6页
3136-3141