近红外光谱的选择比率竞争群体分析的变量选择算法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3964/j.issn.1000-0593(2020)04-1056-07

近红外光谱的选择比率竞争群体分析的变量选择算法

引用
光谱分析是化学计量学的一个重要应用方向,并已被广泛应用到各个领域,其中光谱变量选择又是光谱分析的重要环节.研究不同的变量选择方法客观地识别有用的信息变量和消除无关或干扰变量十分关键.提出了一种新的变量选择方法,命名选择比率的竞争性群体分析法(SRCM PA).该算法采用选择比率,自适应加权采样和模型群体分析的思想,并结合了变量排列和指数递减函数方法.关键波长定义为多元线性回归模型中得分值较大的波长,将线性模型PLS下的选择比率的得分值作为评价各波长重要性的指标,然后,根据每个波长的重要性,SRCM PA依次从蒙特卡罗采样中选择N个波长子集,以迭代和竞争的方式运行.在每一次采样运行中,以固定比率的样品以建立校准的PLS模型并计算每个变量的选择比率值,基于排序选择比率的得分值和作为权重的归一化的SR(选择比率)得分值,采用指数递减函数的强制选择和自适应加权采样竞争选择的两步过程来选择关键变量.最后,应用交叉验证(C V)方法来选择具有最低交叉验证均方根(RMSECV)的子集作为最优子集.该算法已在小麦蛋白数据集和啤酒数据集上进行了测试,并使用三种高效算法作对比.通过对实验结果来评估算法优越性,该算法能够找到数据集的关键波长变量的最佳组合,并能用于解释感兴趣的化学特性,通过建模后的评价结果也是最佳的.该算法在啤酒光谱数据集的运行结果,相较于啤酒数据集的全光谱PL S模型,变量个数由567个减少到42个左右.并且模型的RM-SECV由0.622下降到0.115,RMSEP由0.823减少到了0.263左右,预测精度分别提高了81.5% 和68.1%.Q2_CV和Q2_test也分别由0.940,0.852提高到了0.994和0.995.在小麦蛋白数据集的运行结果,相较于于小麦蛋白光谱数据集的全光谱PLS模型,变量个数由175个减少到18个左右.并且模型的RMSECV由0.607下降到0.292,RMSEP由0.519减少到了0.234左右,预测精度分别提高了51.9% 和54.9%.Q2_CV和Q2_test也分别由0.748,0.774提高到了0.931和0.839.

变量选择、选择比率、自适应加权采样、群体模型分析、蒙特卡罗采样

40

O65(分析化学)

国家自然科学基金项目;中华人民共和国教育部国际科技合作项目2016-2196资助

2020-05-11(万方平台首次上网日期,不代表论文的发表时间)

共7页

1056-1062

相关文献
评论
暂无封面信息
查看本期封面目录

光谱学与光谱分析

1000-0593

11-2200/O4

40

2020,40(4)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn