基于out-of-bag样本的随机森林算法的超参数估计
随机森林是一种有效的分类树集成算法,但为了使它具有较高的预测精度,要采用某种方法确定其超参数的最优值.在不额外增加计算复杂性的前提下,提出了一种基于out-of-bag样本估计其超参数取值的方法.仿真试验的结果表明,利用文中提出的方法所选取的超参数在多数情况下都能使随机森林算法的分类效果达到最优.
集成学习、随机森林、泛化能力、Bootstrap样本、out-of-bag样本、交叉确认法
26
O212;TP181(概率论与数理统计)
教育部人文与社会科学基金资助项目09YJA790174;河南省软科学基金资助项目102400450126;教育部博士学科点专项科研基金20100201120048
2012-01-15(万方平台首次上网日期,不代表论文的发表时间)
共7页
566-572