10.3964/j.issn.1000-0593(2023)01-0050-07
基于SiPLS-SPA波长优选的血红蛋白定量分析研究
血红蛋白是人体的一项重要生理指标,浓度异常会导致人体产生各种疾病.红外光谱技术具有简单、无损、快速等优点,非常适合用于生理参数的定量分析.由于光谱背景复杂、有效信息弱,如何提取有效特征变量,构建精准定量模型是个难题.针对此问题,以血液样本和血红蛋白仿体溶液样本光谱数据为研究对象,采用SPXY法、K_S法、duplex法、等间隔划分法四种数据集划分方法划分数据并通过建模对比,优选出最佳数据集划分方法为SPXY法.遍历了SavitzkyGolay一阶求导滤波(S_G1)+小波变换、小波变换+S_G1、标准正态变量变换(SNV)+S_G1三种预处理方法,优选出SNV+S_G1预处理方法.结合串联思想,提出组合区间偏最小二乘法(SiPLS)与连续投影算法(SPA)串联的特征波长优选方法,构建SiPLS-SPA-PLS预测模型,用两组数据对模型进行验证,依据评价指标判断模型的优劣,并与全谱PLS,SPA-PLS和SiPLS三种定量模型相比较.实验结果表明:(1)使用SiPLS-SPA-PLS模型进行定量分析,血液样本的Rc,Rp,RMSEC和RMSEP值分别为0.9936,0.9906,0.1992和0.1846,仿体溶液样本的Rc,Rp,RMSEC和RMSEP值分别为0.9989,0.9985,1.8489和2.0074.相比全谱PLS,SPA-PLS,SiPLS三种定量模型,Rc和Rp值最大,RMSEC和RMSEP值最小,该模型最优,可以更精准地实现血红蛋白的定量分析.(2)SiPLS-SPA-PLS定量模型能更加准确地筛选最优波段,两种样本筛选出来的有效波段分别为血液(1144~1264,1606~1798 nm)、仿体溶液(1018~1390,1600~1700 nm),剔除掉仪器的影响因素,大致相同,此方法可以精准优选出特征波长.(3)该模型可以提取有效变量,去除无用噪声影响,血液样本从全谱的700个光谱变量中优选出28个,仿体溶液样本从全谱的1201个光谱变量优选出41个,提高检测速度和预测效率.该方法为血红蛋白快速精准检测提供了一种思路.
红外光谱、SiPLS-SPA、定量分析、波长优选
43
O433.1(光学)
国家自然科学基金;国家自然科学基金;中南民族大学中央高校基本科研业务费专项资金项目
2023-02-13(万方平台首次上网日期,不代表论文的发表时间)
共7页
50-56