10.13232/j.cnki.jnju.2021.04.006
基于密度峰值聚类和模糊支持度的boosting随机森林
为了解决传统分类算法在不平衡样本集上分类效果不佳的问题,提出一种新的欠采样boosting集成算法(FECBoost).首先,通过改进的模糊熵反映样本集原始分布的不确定性,并用此模糊熵判断多数类样本所在的区域,称为安全区域或边界区域;其次,利用密度峰值聚类算法选取安全区域的代表性样本以减少分类器的训练时间和样本间的重叠,降低样本的不平衡度,实现静态欠采样;最后,训练新的boosting集成分类器,在算法每一次迭代之前,基于模糊熵和模糊支持度对多数类样本再次欠采样,使用于训练的样本集达到平衡.该动态欠采样依赖于分类器的训练过程,充分考虑了样本分布的不确定性和错分可能性.通过在真实样本集上的仿真实验验证了提出方法的有效性.
类不平衡;模糊熵;模糊支持度;boosting集成算法
57
TP311.13(计算技术、计算机技术)
国家自然科学基金61573266
2021-10-26(万方平台首次上网日期,不代表论文的发表时间)
共9页
582-590