10.3964/j.issn.1000-0593(2021)04-1119-06
集成学习算法的红外光谱定量回归模型
近年来,深度学习在数据挖掘领域研究较多,深度学习中的集成学习算法也越来越多地应用到分类和定量回归中,但是,集成学习算法在红外光谱分析领域的应用研究较少.提出一种基于Blending模型融合的集成学习定量回归算法,利用GBDT算法、线性核支持向量机(LinearSVM)和径向基核支持向量机(RBF SVM)作为基学习器,将基学习器预测结果通过LinearSVM模型完成数据融合.以公开数据库中的药片和柴油近红外光谱数据为研究对象,首先对光谱数据进行一阶导数预处理,分别采用单核支持向量回归模型、GBDT模型和Blending集成学习模型,将模型预测结果进行分析比较.药片活性物含量和硬度性质采用RBF SVM模型的预测结果最优,RMSEP最小,RPD最大;其次为Blending集成学习模型;GBDT模型预测结果最差.药片质量采用Blending集成学习模型预测的R2最高,达到0.8374;RBF SVM的RMSEP最小,为2.1406,RPD最大,达到7.4878;LinearSVM的预测结果最差.对于柴油沸点、闪点和总芳香烃三种性质,Blending模型预测效果最好,优于三种单模型预测结果.对于十六烷值,GBDT模型和RBF SVM模型预测结果优于Blending集成学习模型.对于密度,仅GBDT模型优于Blending集成模型,并且,使用单模型和集成模型的预测结果均较为理想,除了LinearSVM模型R2为0.9445,其他模型R2均高于0.99.对于冰点的预测,RBF SVM和LinearSVM的预测效果优于Blending集成学习模型.对于黏性性质的预测,仅RBF SVM的预测效果优于Blending集成算法模型.由结果可以看出,由GBDT,LinearSVM和RBF SVM集成的Blending模型由于融合了单模型的特征,与单模型相比,预测效果较优或者最优,证明集成学习Blending模型用于红外光谱定量回归具有较强的适用性,且具有较高的预测精度和泛化能力,对于进一步研究集成学习算法在红外光谱定量回归中的应用具有重要的意义.
集成学习、支持向量机、GBDT、定量回归
41
TP181(自动化基础理论)
国家重大科技专项项目;安徽省高校自然科学研究重点项目
2021-04-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
1119-1124