大数据环境下利用随机森林算法和决策树的贫困生认定方法
针对当前校园扶贫工作普遍存在的"隐形贫困"及疑似"虚假贫困"等问题,提出了利用随机森林算法和决策树的贫困生认定方法.首先,利用智慧校园大数据环境获取高校内学生的基本信息、消费信息等数据,找出10个具有分类能力的特征;然后使用基于permutation随机置换的残差均方减小量来衡量对于变量重要性评分;最后,基于随机森林算法和决策树进行判别与分类.实验结果表明,提出的方法具有一定的准确性,相比Adaboost方法,无论是预测准确度还是平均绝对误差,随机森林方法都更出色.
贫困生认定、大数据、随机森林算法、决策树、数据清洗
40
TP309(计算技术、计算机技术)
山西省科技厅基础研究计划项目2014021039-6
2019-04-09(万方平台首次上网日期,不代表论文的发表时间)
共6页
115-120