DOI：10.3969/j.issn.2095-2716.2021.03.018

不平衡数据的加权集成分类算法

引用

摘要：

不平衡数据的集成学习分类,存在数据子集划分难以覆盖整体数据分布、基分类器权重设置主观性强等问题,鉴于此,提出不平衡数据分类的矩阵粒加权集成分类算法.首先,采用bagging粒化算法划分数据集,形成若干矩阵粒数据子集;然后,应用矩阵距离算法,计算矩阵粒与全一矩阵之间的距离作为集成规则权重;以各矩阵粒为单位构建CART基分类器分别训练;最后,采用矩阵粒距离权重集成规则实现集成分类,以KEEL数据库中不平衡数据集为实验数据,验证了算法的有效性.仿真结果表明,矩阵粒加权集成分类算法具有较高的分类准确性,是对不平衡数据分类算法研究的一次有益尝试和补充.

关键词：矩阵粒、不平衡数据、权重、决策树、集成学习

所属期刊栏目：43

分类号：TP311.13(计算技术、计算机技术)

资助基金：河北省自然科学基金F2014209086

在线出版日期：2021-07-07（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：125-132

英文信息展示

期刊专题