基于多源异构数据的典型场地土壤重金属污染模拟预测研究
土壤是人类生存发展的基础,随着我国工业化、城市化的不断推进,土壤重金属污染的风险也逐年增加.为研究基于非采样多源异构数据进行场地土壤重金属污染模拟预测的科学性,探究不同变量对不同重金属元素污染的重要程度与影响规律,本文选取浙江省104块典型污染场地为研究对象,基于质量平衡原则构建场地土壤重金属污染风险识别指标体系,包括企业生产、大气沉降、植物富集、土壤淋溶4个大类变量和20个小类变量,利用详实的场地土壤污染调查成果,采用随机森林(RF)、特征重要性分析方法,建立预测模型并探究变量的重要性.结果表明:①基于场地均值的RF预测模型的决定系数均值(R2mean=0.75)相较于基于场地最大值的模型的决定系数(R2mean=0.62)较高,该模型方法对场地重金属污染均值的预测能力优于场地最大值,基于均值的预测模型精度从高到低依次为镍>汞>镉>铅>铜>砷.基于最大值的预测模型精度从高到低依次为镉>镍>砷>铅>铜>汞,基于内梅罗综合污染指数的预测模型决定系数(R2=0.84)较单一重金属预测模型的平均水平较高,低于镍(R2=0.92)、汞(R2=0.91)的基于均值的预测模型;②模型对极端高值的预测能力较差,多源异构数据库对该类样本的的表征能力较弱,是导致基于最大值的模型整体精度低于基于均值的模型的主要原因;③以平均特征重要性作为评判依据,工业环境影响等级(15.57%)、土壤黏粒占比(9.55%)、公路密度(8.44%)、企业运行时间(7.31%)、太阳辐射强度(7.06%)、企业创立时间(6.56%)是与土壤重金属污染密切相关的变量指标.本研究旨在探索研究一种新的土壤重金属污染分析思路,即使用多源异构数据确定可能存在重金属污染风险的潜在区域,分析不同重金属元素与特征变量之间的重要性关系,为场地土壤重金属污染调查与修复提供科学和高效的手段.
土壤重金属污染、预测模型、多源异构数据、随机森林、特征重要性
43
X53(土壤污染及其防治)
国家重点研发计划No.2020YFC1807501
2023-10-17(万方平台首次上网日期,不代表论文的发表时间)
共12页
357-368