10.13995/j.cnki.11-1802/ts.035198
基于集成学习和近红外光谱的蓝莓贮藏品质检测方法研究
针对传统化学方法测定蓝莓贮藏品质存在工序复杂、成本高等问题,提出一种基于集成学习和近红外光谱技术的无损检测方法.以 150 个瑞卡蓝莓样本和 30 个绿宝石蓝莓样本为研究对象,利用近红外光谱仪采集不同贮藏时间的瑞卡蓝莓和不同成熟度的绿宝石蓝莓近红外反射光谱.利用光谱-理化值共生距离法(sample set partitioning based on joint X-Y distance,SPXY)将瑞卡蓝莓样本按照 4∶1 的数量比划分为训练集和验证集,绿宝石蓝莓样本为测试集,统一采用偏最小二乘法(partial least squares regression,PLSR)对比分析标准正态变换(standard normal variate transformation,SNV)、数据标准化(Z-score standardization,Z-score)、一阶导数(first derivative,1st-D)、二阶导数(second derivative,2nd-D)中一种或几种组合方法对原始光谱的预处理效果,使用竞争性自适应重加权采样法(competitive adaptive reweighted sampling,CARS)对蓝莓近红外光谱特征波长进行筛选,将支持向量回归(support vector regression,SVR)、极端梯度上升(extreme gradient boosting,XGBoost)和多层感知机(multilayer perceptron,MLP)作为基模型,采用Stacking集成策略,建立Stacking集成学习模型.将与蓝莓贮藏品质最为相关的维生素 C、可溶性固形物(soluble solids content,SSC)和花青素作为标签,分别训练 4 种预测模型,其中 Stacking集成模型最优,维生素 C、SSC 和花青素测试集相关系数 R2 分别为 0.872 6、0.881 4 和0.905 5,均方根误差(root mean square error,RMSE)分别为 0.566 4、0.696 3 和 1.693 9,相对分析误差(relative percent deviation,RPD)分别为 2.801 6、2.903 7 和 3.253.结果表明,该文提出的 Stacking 集成学习模型融合SVR、XGBoost和MLP的优势,具有精度高,稳定性好,泛化能力强的特点,可为蓝莓无损检测研究提供新的思路.
近红外光谱、集成学习、蓝莓、无损检测、支持向量回归、极端梯度上升、多层感知机
49
TS207.3;TP391.41;TP181
黑龙江省自然科学基金项目LH2020C050
2023-10-13(万方平台首次上网日期,不代表论文的发表时间)
共9页
306-314