10.19756/j.issn.0253-3820.210456
基于变量频次加权自助采样法的近红外光谱变量选择方法研究
近红外光谱分析技术已被广泛应用于食品检测及定量分析等领域.变量选择作为近红外光谱建模分析中的关键步骤,对于提高模型的稳定性和预测性能具有重要作用.本研究提出了一种近红外光谱变量选择方法,即变量频次加权自助采样法(Variable frequency weighted bootstrap sampling,FWBS),通过二进制矩阵采样(BMS)法随机组合生成不同变量子集,利用偏最小二乘法(PLS)建立不同变量子集的子模型,统计每个变量在子模型中出现的频率,并进行归一化处理,得到变量的初始权重,最后结合加权自助采样法(WBS)选取最佳特征变量.以玉米和牛奶近红外光谱公共数据为例,构建了玉米中淀粉含量预测模型和牛奶中蛋白质含量预测模型.结果表明,FWBS-PLS预测模型与无信息变量消除结合PLS(UVE-PLS)、竞争性自适应重加权采样结合PLS(CARS-PLS)和自助软收缩结合PLS(BOSS-PLS)预测模型相比,在玉米数据集上的预测均方根误差(RMSEP)分别由0.2523、0.1162和0.0831下降到0.0740,预测精度分别提升了70.7%、36.3%和11.0%,FWBS-PLS预测模型的相对分析误差(RPD)为11.1328;在牛奶数据集上的RMSEP分别由0.1743、0.1437和0.1432下降到0.0887,预测精度分别提升了49.1%、38.3%和38.1%,FWBS-PLS预测模型的RPD为12.2701.基于变量频次加权自助采样法的近红外光谱变量选择方法可以极大程度地简化模型,提高模型的预测精度.
近红外光谱;变量选择;权重;二进制矩阵采样;加权自助采样
49
吉林省科技发展计划项目No.20190701024GH
2021-10-18(万方平台首次上网日期,不代表论文的发表时间)
共7页
1743-1749