10.3979/j.issn.1673-825X.202105160162
基于代表的交叉验证分类
基于代表的邻域覆盖粗糙集分类算法,在某些数据集上表现良好,数据的类别不平衡问题严重影响算法的分类精度.为尽量消除类别不平衡问题的影响,在k折交叉验证方法的基础上,针对基于代表的邻域覆盖粗糙集分类算法,提出了3种集成策略.策略1依靠k折交叉验证,获得对应的k个基分类器,所有的基分类器组成委员会对未分类样本分类;在策略1的基础上,策略2选择分类精度相对较高的基分类器组成委员会,对未分类的样本进行分类;策略3在前2种策略的基础上,利用主动学习的思想,对训练集进行扩充,得到新的分类器再对未分类样本分类.实验所用数据集为UCI标准数据集,且对k的取值做了对比实验.结果显示,3种策略均有不同程度的提升,且k取5时总能取得较好的提升效果.对于不同数据集,应选择相适应的改进策略.
代表选举;粗糙集;分类;集成学习;主动学习
33
TP181(自动化基础理论)
国家自然科学基金;四川省自然科学基金;四川省青年科学技术创新团队;西南石油大学课外开放实验立项
2021-11-25(万方平台首次上网日期,不代表论文的发表时间)
共8页
826-833