10.3969/j.issn.1007-130X.2022.05.004
基于Hellinger距离的不平衡漂移数据流Boosting分类算法
数据流中的不平衡问题会严重影响算法的分类性能,其中概念漂移更是流数据挖掘研究领域的一个难点问题.为了提高此类问题下的分类性能,提出了一种新的基于Hellinger距离的不平衡漂移数据流Boosting分类BCA-HD算法.该算法创新性地采用实例级和分类器级的权重组合方式来动态更新分类器,以适应概念漂移的发生,在底层采用集成算法SMOTEBoost作为基分类器,该分类器内部使用重采样技术处理数据的不平衡.在16个突变型和渐变型的数据集上将所提算法与9种不同算法进行比较,实验结果表明,所提算法的G-mean和AUC的平均值和平均排名均为第1名.因此,该算法能更好地适应概念漂移和不平衡现象的同时发生,有助于提高分类性能.
数据流、不平衡数据、概念漂移、Boosting、Hellinger距离
44
TP391(计算技术、计算机技术)
国家自然科学基金;宁夏自然科学基金项目;宁夏自然科学基金项目;北方民族大学研究生创新项目
2022-06-01(万方平台首次上网日期,不代表论文的发表时间)
共12页
788-799