基于概率分布估计的混合采样算法
在类别不均衡的数据中,类间和类内不均衡性问题都是导致分类性能下降的重要因素。为了提高不均衡数据集下分类算法的性能,提出一种基于概率分布估计的混合采样算法。该算法依据数据概率分别对每个子类进行采样以保证类内的均衡性;并扩大少数类的潜在决策域和减少多数类的冗余信息,从而同时从全局和局部两个角度改善数据的平衡性。实验结果表明,该算法提高了传统分类算法在不均衡数据下的分类性能。
不均衡数据学习、类内不均衡、混合采样、概率分布估计
TP273(自动化技术及设备)
国家自然科学基金项目61001047;中央高校基本科研业务费专项资金项目N110618001
2014-05-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
815-820