10.3969/j.issn.1007-757X.2020.02.021
基于Spark大数据平台的老年病风险预警模型
针对我国社会老龄化进程加快背景下老年病风险预测的需求,设计基于数据挖掘思想的患病风险预警模型.采用决策树模型,根据居民的年龄、性别、BMI指数、家族病史等多项数据进行树结的构建与修剪,同时引入Bagging、Boosting和Rotation Forest等方法进行树的训练.最后,使用Spark中的SQL和MLlib实现并行化的决策模型.仿真结果表明,风险预警的准确率可以达到98.07%.此外,集成学习规模对于模型预测的精度影响较小,决策树的剪枝可在不损失预测精度的前提下降低模型的复杂度.
决策树、集成学习、Spark、疾病预测
36
TP311(计算技术、计算机技术)
陕西省职业技术教育学会项目SZJZX-1821
2020-05-07(万方平台首次上网日期,不代表论文的发表时间)
共4页
71-74