10.11835/j.issn.1000-582X.2018.04.007
基于非平衡数据的随机森林分类算法改进
随机森林算法作为一种组合分类器有较好的分类性能,适合多样的分类环境.算法同样也存在一些缺陷,例如算法处理非平衡数据时不能很好地区分正类和负类.针对这一问题,通过对抽样结果增加约束条件来改进Bootstrap重抽样方法,减少抽样对非平衡性的影响,同时尽量保证算法的随机性.之后利用生成数据的非平衡系数给每棵决策树进行加权处理,提升对非平衡数据敏感的决策树在投票环节的话语权,从而提升整体算法对非平衡数据的分类性能.通过上述两种改进可以明显提高随机森林在决策树数量不足情况下的分类精度.
非平衡数据、随机森林算法、有条件的Bootstrap重抽样、加权的决策树
41
TP391.4(计算技术、计算机技术)
国家自然科学基金资助项目61573266.Supported by National Natural Science Foundation of China 61573266
2018-06-21(万方平台首次上网日期,不代表论文的发表时间)
共9页
54-62