大数据背景下采用互信息与随机森林算法的空气质量预测
为了实现城市空气质量的精准预测,针对与城市空气质量预测相关的大数据种类多、规模大、维度高和生成速度快等特点,在研究城市不同区域空气质量评价指标的基础上,提出不同区域空气质量子空间聚类分析方法,挖掘不同区域空气质量的特征.通过对不同区域进行群体划分,并利用互信息矩阵从城市功能、地形、气象条件等方面辨识与不同区域空气质量相关联的因素,构建基于随机森林算法的城市空气质量预测模型.该方法可以有效识别城市不同区域空气质量的强关联因素,避免由于关联因素的差异性对空气质量预测造成的不利影响.仿真结果表明:该方法适用于大数据的分析与处理,并具有较高的预测精度.
大数据、关联因素辨识、互信息、随机森林、空气质量预测、云计算
37
江苏省高校自然科学研究面上项目17KJB470011
2019-05-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
180-185