基于机器学习的水体化学需氧量高光谱反演模型对比研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3964/j.issn.1000-0593(2022)08-2353-06

基于机器学习的水体化学需氧量高光谱反演模型对比研究

引用
化学需氧量(COD)是水体有机污染的一项重要指标,如何快速准确检测水体的COD含量尤为重要.机器学习在水质反演领域应用日益增多,并取得了较多的研究成果,高光谱遥感具有光谱空间分辨率高、成像通道多等优势,使其在水体COD反演方面有着极大的潜力.利用不同的高光谱预处理方法对原始高光谱数据进行处理,并利用处理前后的高光谱数据对比研究了不同机器学习模型、不同高光谱预处理方法对水体COD的反演性能.首先利用ZK-UVIR-I型原位光谱水质在线监测仪在扬州宝带河实地收集了1548组COD和对应的高光谱数据(400~1000 nm)样本,为降低光谱噪音干扰以及消除光谱散射影响,分别使用Savitzky-Golay(SG)平滑、多元散射校正数据(MSC)以及SG平滑结合MSC对原始光谱进行预处理.其次,将样本集随机划分为训练集和测试集,其中训练集占比80%,测试集占比20%.对预处理后的训练集全波段光谱基于线性回归、随机森林(random forest)、AdaBoost、XGBoost四种机器学习方法建立COD高光谱反演模型,并选取了决定系数(R2)、均方根误差(RMSE)、相对分析误差(RPD)三种指标在测试集数据中评估高光谱反演模型的精度.结果表明,随机森林、AdaBoost、XGBoost均优于线性回归,无论光谱处理与否,通过XGBoost建立的反演模型预测能力均为最佳,其中使用XGBoost对经过SG平滑和MSC处理后的光谱数据进行建模的反演模型精度最高,其R2达到0.92,RMSE为7.1 mg·L-1,RPD为3.4.考虑到原始光谱可能存在冗余,通过主成分分析法(PCA)对经过SG平滑和MSC处理后的光谱进行降维,并选取累计贡献率达到95% 的前十个主成分作为模型的输入变量.通过XGBoost建立反演模型,结果表明经过PCA后的反演模型不仅精度有所上升,RPD达到3.8,而且模型的训练时间也由72 s缩短到2.9 s.以上研究可为该水域及类似水域的高光谱水质反演模型的建立提供新的方法及思路.

化学需氧量、机器学习、高光谱、反演模型对比

42

O433.4(光学)

中国科学院科研装备研制项目;国家自然科学基金

2022-08-17(万方平台首次上网日期,不代表论文的发表时间)

共6页

2353-2358

相关文献
评论
暂无封面信息
查看本期封面目录

光谱学与光谱分析

1000-0593

11-2200/O4

42

2022,42(8)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn