10.13232/j.cnki.jnju.2022.04.003
基于粗糙集和改进二进制布谷鸟搜索算法的高维数据特征选择
在大数据时代,数据多具有规模大、类别多、维度高和样本小等特点,使其特征空间中存在大量冗余和不相关的信息.这些冗余及不相关信息会影响模型的性能,增加计算负担,故特征子集的筛选是数据处理中不可或缺的一环.针对特征选择的数据量大、分类准确率低的问题,提出一种基于粗糙集和改进二进制布谷鸟搜索算法的高维数据特征选择模型.首先,为了加强布谷鸟算法的寻优能力,融合差分进化中变异交叉选择的思想;其次,利用新的鸟巢更新机制寻找优质特征,提升特征选择效果;最后,结合粗糙集构建合适的适应度函数进行评判.为了验证算法的性能,在UCI数据集上选取三种不同分类器进行实验,并利用Friedman检验与Nemenyi后续检验对实验数据进行评估.实验结果表明,提出算法的平均分类准确率达到88.7%,和其他算法相比,在特征选择方面更有优势.
特征选择、粗糙集、二进制布谷鸟搜索算法、差分进化、UCI数据集
58
TP18(自动化基础理论)
国家自然科学基金;湖南省自然科学基金;湖南省教育厅科学研究项目
2022-09-08(万方平台首次上网日期,不代表论文的发表时间)
共10页
584-593