10.3969/j.issn.1673-5692.2012.03.005
一种不平衡数据的分类方法
针对数据挖掘和机器学习领域中常遇到的数据不平衡问题,分析了数据的不平衡性及目前解决不平衡问题的主要策略,提出了一种基于组合的不平衡数据分类方法,该方法将数据重取样与权重润饰结合,以降低分类器对大类别的偏好。实验结果表明,权重润饰能够较好的弥补重取样方法的某些不足,该组合方法可有效提高不平衡数据分类精度。
不平衡数据、文本分类、重取样、权重润饰、组合
7
TP391(计算技术、计算机技术)
2012-09-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
246-251