基于气象因子的随机森林算法在塔河地区林火预测中的应用
[目的]应用逻辑斯蒂回归模型和随机森林算法建立大兴安岭塔河地区林火发生的预测模型并对比模型预测精度,判断随机森林算法在该地区林火预测中的适应性,为该地区林火管理工作提供技术支持.[方法]利用1974—2008 年大兴安岭塔河地区森林火灾发生数据,分别运用二项逻辑斯蒂回归模型和随机森林算法,对塔河地区林火发生与气象因子之间的关系进行实证分析.为减少训练样本分布对试验结果的影响,将全样本数据随机分成60%的训练样本和40%的测试样本,并且进行5 次重复,建立5 个中间模型(样本组).选择在5 个中间模型中的3 个及以上的显著变量(因子)对全样本数据进行分析并分别比较2 种模型算法在5 个中间模型和全样本模型中的预测准确率.此外,还设计了变量交互试验进一步验证相同变量下 2 种模型的预测精度.[结果]日最小相对湿度、细小可燃物湿度码和干旱码3 个因子在二项逻辑斯蒂回归模型和随机森林算法中均与林火发生呈显著相关.模型拟合的预测结果显示:在对 5 个中间模型的预测中,随机森林算法对训练样本( 60%)和测试样本(40%)的预测准确率分别高于二项逻辑斯蒂回归模型8%和10%左右; 在全样本模型的预测中,随机森林算法拟合的准确率为85. 0%,而二项逻辑斯蒂回归模型拟合的准确率为76. 2%,二者相差10%左右,与之前5 个中间模型的预测结果一致; 在变量交互试验中,随机森林算法拟合的准确率为 86. 0%,而二项逻辑斯蒂回归模型拟合的准确率为72. 8%,随机森林算法的预测准确率提高了18. 1%左右.[结论]日最小相对湿度、细小可燃物湿度码和干旱码是影响林火发生的主要气象因子.在基于气象因子的塔河地区林火发生预测模型研究中,随机森林算法的预测准确率高于传统二项逻辑斯蒂回归模型10%左右,具有一定的预测优势和应用价值,可为大兴安岭塔河地区林火预测和决策提供参考.
塔河地区、林火发生、气象因子、随机森林算法、逻辑斯蒂回归
52
S762.2(森林保护学)
福建省自然科学基金;福建农林大学重点项目
2016-04-14(万方平台首次上网日期,不代表论文的发表时间)
共10页
89-98