10.13272/j.issn.1671-251x.17502
面向不平衡数据集的煤矿监测系统异常数据识别方法
异常数据识别对于煤矿安全监测系统具有重要作用,但安全监测系统中异常数据一般只占数据总量的1%左右,不平衡性是此类数据的固有特点.目前多数机器学习算法在不平衡数据集上的分类预测准确率和灵敏度都相对较差.为了能准确识别异常数据,以煤矿分布式光纤竖井变形监测系统采集的数据为研究对象,提出了一种面向不平衡数据集、基于去重复下采样(RDU)、合成少数类过采样技术(SMOTE)和随机森林(RF)分类算法的煤矿监测系统异常数据识别方法.该方法利用RDU算法对多数类数据进行下采样,去除重复样本;利用SMOTE算法对少数类异常数据进行过采样,通过合成新的异常数据来改善数据集的不平衡性;并利用优化后的数据集训练RF分类算法,得到异常数据识别模型.在6个真实数据集上的对比实验结果表明,该方法的异常数据识别准确率平均值达到99.3%,具有较好的泛化性和较强的鲁棒性.
煤矿安全监测、异常数据识别、不平衡数据集、机器学习、大数据、下采样、过采样、随机森林
46
TD76(矿山安全与劳动保护)
国家重点研发计划项目;国家自然科学基金资助项目;陕西省教育厅科研计划项目
2020-05-07(万方平台首次上网日期,不代表论文的发表时间)
共8页
18-25