10.3969/j.issn.1000-1441.2023.02.003
基于改进集成学习的测井岩性识别方法研究
测井数据中存在大量与岩性无关的冗余信息,且各类岩性标签数据分布不均匀,严重影响岩性识别准确率,现有测井岩性识别算法无法有效解决岩性类间不平衡问题.为此提出了一种针对不平衡样本集的集成学习岩性预测方法KSMOSEL:首先以录井岩性数据为岩性样本标签,将测井曲线作为模型输入;然后将K-means算法与合成少数类过采样技术(SMOTE)相结合形成K-means-合成过采样算法,即KS采样算法,对岩性样本集进行平衡化处理;最后将采样后的数据集用于构建集成学习模型并训练,采用多个分类器模型融合构成强学习器,通过"软投票"方式预测岩性类型.以Hugoton油气田测井岩性数据为基础,采用改进不平衡样本集的集成学习岩性预测方法对岩性进行分类,并将识别效果与传统的分类模型:支持向量机、K最近邻分类、决策树、XGBoost和随机森林等模型进行对比.试验结果表明:KSMOSEL方法具有更高的精度,岩性识别准确率达到94.28%;KS采样之后,支持向量机、K最近邻分类、决策树、XGBoost、随机森林、GBDT和集成学习等模型岩性识别准确率分别提高了 18.68%,12.03%,3.77%,10.23%,24.77%,16.69%,19.37%,在测井岩性数据分布比例不平衡时极大地提升了岩性识别的准确率.
岩性识别、非平衡数据、过采样、KSMOSEL、测井数据
62
P631
国家重点研发计划;四川省科技项目
2023-04-04(万方平台首次上网日期,不代表论文的发表时间)
共13页
212-224