10.3964/j.issn.1000-0593(2017)06-1733-06
基于最小角回归与GA-PLS的NIR光谱变量选择方法
近红外(NIR)光谱一般具有较多的波长变量数,对其直接或间接地进行变量选择是提高模型稳定性能及预测性能的关键.最小角回归(LAR)是一种相对较新和有效的机器学习算法,常用于进行回归分析和变量选择.面向光谱建模应用,提出一种LAR结合遗传偏最小二乘法(GA-PLS)的变量选择方法,可有效筛选出少数特征波长点.首先在全光谱区利用LAR消除变量间的共线性得到初筛波长点,然后用GA-PLS对LAR筛选出的波长点进一步优选从而得到最终建模用的特征波长点.为验证本文方法的有效性,以药片和汽油的近红外光谱回归分析作为应用案例,对原光谱进行预处理后,采用该方法进行变量筛选,然后分别建模其中的活性成分含量和C10含量.结果显示,在这两个应用中,最终优化得到的特征波长点数均只需七个,而两者的预测决定系数R2分别达到0.933 9和0.951 9,与全光谱、无信息变量消除法(UVE)和连续投影算法(SPA)等方法相比,特征波长点更少,同时R2p和预测均方根误差RMSEP值更优.因此,LAR结合GA-PLS,能有效地从近红外光谱中选择出信息变量从而减少建模波数,提高预测精度,拥有较好的模型解释性.该方法可为特定领域的专用光谱仪设计提供有效的波长筛选工具.
近红外光谱、最小角回归、变量选择、共线性、遗传偏最小二乘法
37
O657.3(分析化学)
国家自然科学基金项目21365008,61562013;广西壮族自治区自然科学基金项目2013GXNSFBA019279;桂林电子科技大学研究生创新项目GDYCSZ201474,GDYCSZ201478
2017-07-31(万方平台首次上网日期,不代表论文的发表时间)
共6页
1733-1738