10.16208/j.issn1000-7024.2018.01.040
基于特征聚类的封装特征选择算法
针对多维数据集,为得到一个最优特征子集,提出一种基于特征聚类的封装式特征选择算法.在初始阶段,利用三支决策理论动态地将原始特征集划分为若干特征子空间,通过特征聚类算法对每个特征子空间内的特征进行聚类;从每个特征类簇里挑选代表特征,利用邻域互信息对剩余特征进行降序排序并依次迭代选择,使用封装器评估该特征是否应该被选择,可得到一个具有最低分类错误率的最优特征子集.在UCI数据集上的实验结果表明,相较于其它特征选择算法,该算法能有效地提高各数据集在libSVM、J48、Naive Bayes以及KNN分类器上的分类准确率.
特征选择、特征聚类、封装器、邻域互信息、三支决策
39
TP301.6(计算技术、计算机技术)
国家自然科学基金项目61309014;教育部人文社科规划基金项目15XJA630003;重庆市基础与前沿研究计划基金项目cstc2013jcyjA40063;重庆市教委科学技术研究基金项目KJ1400412;重庆市教委科学技术研究基金项目KJ1500416
2018-04-28(万方平台首次上网日期,不代表论文的发表时间)
共8页
230-237