10.3969/j.issn.2095-2716.2021.03.018
不平衡数据的加权集成分类算法
不平衡数据的集成学习分类,存在数据子集划分难以覆盖整体数据分布、基分类器权重设置主观性强等问题,鉴于此,提出不平衡数据分类的矩阵粒加权集成分类算法.首先,采用bagging粒化算法划分数据集,形成若干矩阵粒数据子集;然后,应用矩阵距离算法,计算矩阵粒与全一矩阵之间的距离作为集成规则权重;以各矩阵粒为单位构建CART基分类器分别训练;最后,采用矩阵粒距离权重集成规则实现集成分类,以KEEL数据库中不平衡数据集为实验数据,验证了算法的有效性.仿真结果表明,矩阵粒加权集成分类算法具有较高的分类准确性,是对不平衡数据分类算法研究的一次有益尝试和补充.
矩阵粒、不平衡数据、权重、决策树、集成学习
43
TP311.13(计算技术、计算机技术)
河北省自然科学基金F2014209086
2021-07-07(万方平台首次上网日期,不代表论文的发表时间)
共8页
125-132