基于重复度分析的森林优化特征选择算法
森林优化算法是一种基于森林中树木播种思想的演化算法,其具有良好的特征空间搜索能力,且实现难度低.但该算法在森林整体的收敛速度和寻优能力上仍存在提升空间,而且对高维数据集的适应度较差.本文针对上述问题提出了基于重复度分析的森林优化特征选择算法(feature selection using forest optimization al-gorithm based on duplication analysis,DAFSFOA).该算法提出了基于信息增益的自适应初始化策略、森林重复度分析机制、森林重启机制、候选最优树生成策略、综合考虑特征选择数量和分类正确率的适应度函数.实验结果表明,DAFSFOA在大部分数据集上达到了最高的分类准确率.同时,对于高维数据集SRBCT,在维度缩减率和分类准确率方面,DAFSFOA对比森林优化特征选择算法(feature selection using forest optimization algorithm,FSFOA)都有较大提升.DAFSFOA比FSFOA具有更强的特征空间探索能力,而且能够适应不同维度的数据集.
特征选择、演化算法、重复度分析、信息熵、信息增益、重启机制、森林优化算法、维度缩减
17
TP301(计算技术、计算机技术)
黑龙江自然科学基金资助项目LH2020F023
2023-01-11(万方平台首次上网日期,不代表论文的发表时间)
共10页
1113-1122