10.3964/j.issn.1000-0593(2014)04-0947-05
光谱多元分析校正集和验证集样本分布优选方法研究
分析了校正集和验证集样品数随性质分布不均匀性对光谱多元分析校正的不良影响,揭示了实际光谱多元校正中“均值化”现象,即性质值小的样本预测值结果偏大,性质值大的则偏小,提出了一种优选样品新方法-Rank-KS。其综合考虑光谱空间和性质空间对样本进行挑选,将性质空间平均分为若干小区间,在每个小区间内分别利用Kennard-Stone法和随机法进行校正集和验证集样本的挑选,这样得到的校正集和验证集可明显改善样本数随性质分布的均匀性。以红外光谱测定汽油中碳酸二甲酯(DMC )含量和近红外光谱测定二甲亚砜溶液二甲亚砜浓度为研究对象,分别采用Rank-KS、随机法、Kennard-Stone、浓度梯度法和SPXY等方法选择校正集和验证集样品,使用多元线性回归和偏最小二乘法建立模型,比较这些方法对光谱多元校正分析的影响,结果表明Rank-KS方法可改善校正集和验证集样品数随性质分布的均匀性;对于样本数分布中间局部样本多和两端局部少、或者局部没有样本的样本集,使用Rank-KS算法挑选校正集,无论使用MLR还是PLS1建立多元分析模型,均能明显改善其模型预测能力,使得到的模型的预测均方根最小。
样本分集、PLS回归、Kennard-Stone理论、近红外光谱、红外光谱
O657.3(分析化学)
国家科技支撑计划课题2011BAE11B00;国家863计划项目2009AA04Z135;国家自然科学基金项目60974065
2014-04-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
947-951