10.3969/j.issn.1007-3116.2021.08.002
基于学生化极差分布的随机森林变量选择研究
变量选择一直是统计分析与推断中的重要研究内容.针对该研究内容,提出一种基于随机森林的变量选择新方法.以随机森林中的最小深度重要性度量和置换重要性度量为基础,对得到的变量最小深度重要性得分和置换重要性得分,引入学生化极差分布进行变量重要性得分差异是否显著的检验.根据检验的结果将变量分组,对分组变量采用逐步回归方法挑选.运用新方法在模拟设计的线性模型、二次函数模型和复杂模型上,都能够选出真正变量,验证了新方法的有效性和可行性.经典的波士顿房价数据上的运用分析给出了新方法的实用性.
学生化极差分布;随机森林;变量选择;最小深度重要性;置换重要性
36
O212(概率论与数理统计)
广东省自然科学基金面上项目"机器学习方法在纵向数据分析中的稳健性研究";广东财经大学校级学位与研究生教育改革研究项目"科教融合视角下研究生培养模式探索与实践"
2021-10-26(万方平台首次上网日期,不代表论文的发表时间)
共8页
15-22