10.3964/j.issn.1000-0593(2022)06-1721-07
基于XGBoost的糖尿病血液拉曼光谱定量分析法
血液中包含着大量的生物信息,如激素、酶、血糖等成分,而血糖偏高将引发糖尿病.糖尿病有很多并发症,比如脑梗塞,脑出血,肾脏损害,眼底损害,周围神经病变等一系列疾病.目前,血液常规成分检测分析周期较长,结果反馈较慢,难以实现快速连续检测.光学检测技术能够根据待测物质的光谱鉴别物质化学成分和相对含量,因其灵敏度高、适用性强、分析速度快等优势,在血液无创检测领域逐渐发挥其优势.随着激光技术的不断进步,拉曼光谱技术作为一种非线性散射光谱技术,在血液检测技术中得到了广泛应用.为提高拉曼光谱的预测精度,首次将XGBoost算法应用到拉曼光谱血液血糖浓度中进行预测精度的提升.实验中106组血液样本及试验标准值为河北省秦皇岛市第一医院提供,选用布鲁克的MultiRAM光谱仪进行血液的拉曼光谱数据测量,实验中1064 nm激发光源功率为400 mW,光谱分辨率为6 cm-1,扫描速率为10 kHz,扫描范围为400~4000 cm-1,对每个样本重复采集10次并计算平均值作为原始光谱数据,以保证实验的准确性和可重复性.该方法无需对数据进行预处理,首先将光谱数据随机划分为训练集和测试集,比例为7:3,训练集用于训练模型并确定模型参数,测试集用于测试模型的稳定性和预测精度.建立XGBoost模型后,用网格搜索法和k折交叉验证优化模型参数;引入模型评估指标和克拉克网格误差分析图对XGBoost模型血糖浓度的预测进行分析;最后将XGBoost模型与决策树(DT)、随机森林(RF)和支持向量机回归(SVR)模型进行对比.实验结果表明通过XGBoost建立的定量回归模型效果最佳,模型的决定系数为0.99999,校正集均方误差为0.00749,预测集均方误差为0.00717,相对分析误差为331.97318,预测点均落在克拉克网格误差分析图的A区.结果证明,将XGBoost算法应用到拉曼光谱血液成分定量分析中具有较高的预测精度,并且数据未经过预处理,可以有效缩短程序运行时间,其在拉曼光谱以及近红外光谱定量分析领域具有广阔的发展前景.
XGBoost、拉曼光谱、血糖、定量回归
42
O433.4(光学)
国家自然科学基金;国家自然科学基金;河北省自然科学基金;河北省自然科学基金;河北省自然科学基金;中央高校基本科研业务费专项资金项目;中央高校基本科研业务费专项资金项目
2022-06-20(万方平台首次上网日期,不代表论文的发表时间)
共7页
1721-1727