改进随机森林模型在人口空间化中的应用
基于随机森林模型的人口空间化方法未考虑人口空间分布非平衡性,利用Bootstrap采样加剧样本的不均衡性,使其不具有代表性,造成模型预测精度较低.针对此问题,本文以成都市为例,通过相关性分析提取影响人口分布的特征因子,基于K-means++聚类算法对数据集进行聚类处理,然后利用Bootstrap采样法从各簇中抽取等量的数据融合作为训练子集构建改进随机森林模型,并与传统随机森林模型进行对比.运用改进后的随机森林模型对成都市 2020 年人口数据进行空间化,并与WorldPop数据集进行精度对比.结果表明,基于改进随机森林的人口空间化模型整体精度达 80.5%,较改进前提高了约 3.4%,有效提高了模型预测精度;相较于WorldPop数据集,基于改进随机森林模型的人口空间化结果在拟合度及精度方面均较优.
人口空间化、随机森林、K-means++聚类、成都市
P208(一般性问题)
国家重点研发计划;国家自然科学基金;四川地震科技创新团队专项
2023-07-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
155-160