机器学习算法用于公安一线拉曼实际样本采样学习及其准确度比较
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3964/j.issn.1000-0593(2019)07-2171-05

机器学习算法用于公安一线拉曼实际样本采样学习及其准确度比较

引用
拉曼光谱设备在公安一线中正逐渐得到普及,主要用于检测易燃易爆及易制毒化学品.但在实际应用中,一线人员不会对拉曼设备进行非常准确的使用和操作,不具备专业知识条件的工作人员无法完全按照最佳条件进行检测,经常会发生离焦、偏移、采样时间过短等一系列问题,而检测结果也不可能完全符合标准测试库的算法,给最终结果比对造成非常大的影响.利用五种主流机器学习算法对实际检查、办案过程中采集到的原始数据进行学习分类,通过比较相应的准确度将最佳算法用于改善一线执法、检查过程中拉曼光谱设备的准确性.采集的数据均来自于公安部第三研究所自行研制的EVA3000型拉曼光谱仪,该光谱仪目前已在全国各省、市、地、县进行了一定的配备,一线检测人员会定期将采集的原始数据回传到EV A3000的后台管理系统.通过该管理系统,在线收集实际检查过程中产生的原始数据,以两类易制毒化学品和易燃易爆化学品为例,随机抽取已定性判定的苯乙酸、二氯甲烷、麻黄碱和硝基苯各40例共计160例,并分别利用决策树、随机森林、AdaBoost、支持向量机和人工神经网络算法各进行40,60,100,150,200,300和500次的交叉训练、预测、求取平均准确度.从实验结果可以看出,在五种学习算法中,对于实际样本的预测准确度排序大致为随机森林≈AdaBoost>决策树>SVM>人工神经网络.实际测试的结果与实验过程中的平均预测准确度大体一致.其中随机森林与AdaBoost的准确度相近,其原因在于两者的算法本质都是不断构建新的训练数据集并提高对于错误样本在下次学习中的权重,而SVM和人工神经网络算法的本质都是基于感知器的算法.可见目前几种主流学习算法中,采用自举汇聚(bootstrap aggregating)方式的算法更适应于对实际样本的采样学习,其准确度也较高.在下一步的工作当中,将继续优化现有的算法,将其实现在后台管理系统上,并测试算法对于目前检测中无法定性物质的在线检测功能.该结果对于进一步将机器学习算法用于实际应用、在线分析,改善一线操作人员非正确使用设备对比对结果造成影响,具有重要意义.

拉曼光谱、易燃易爆及易制毒化学品、决策树、随机森林、Adaboost、神经网络、支持向量机、公安一线

39

TP39(计算技术、计算机技术)

国家"十三五"重点研发计划项目2016YFC0801304

2019-07-24(万方平台首次上网日期,不代表论文的发表时间)

共5页

2171-2175

相关文献
评论
暂无封面信息
查看本期封面目录

光谱学与光谱分析

1000-0593

11-2200/O4

39

2019,39(7)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn