10.3969/j.issn.1000-1220.2019.11.007
融合邻域判别指数的混合式特征选择算法
特征选择是机器学习领域的重要课题,基于互信息的特征选择算法在多个领域得到了广泛应用.但是该类方法忽略了属性之间的相互作用对决策结果的影响,无法满足高维特征数据集的分类要求.针对这类问题,提出一种引入邻域判别指数的混合式特征选择算法NDI-RF.首先在特征过滤阶段,利用邻域判别指数作为判决指标,通过图论聚类思想去除冗余特征,获得相关联的代表特征集;然后通过改进随机森林封装器的特征分配机制,结合序列后项搜索策略评估各个特征子集的分类效果;最终通过逐次迭代选择最高分类准确率所对应的特征子集作为最优特征子集.在UCI数据集上的实验结果表明,NDI-RF算法相较于其他特征选择算法,能够有效地减少最优特征子集的大小,同时保证较高的分类准确率.
邻域判别指数、随机森林、图论聚类、混合式特征选择
40
TP301(计算技术、计算机技术)
2019-12-13(万方平台首次上网日期,不代表论文的发表时间)
共6页
2285-2290