10.19678/j.issn.1000-3428.0066458
基于不一致近邻的模糊粗糙集特征选择
模糊粗糙集可突破经典粗糙集仅能处理离散数据的局限,有效对连续型数值进行特征选择.然而,模糊粗糙集以对象为中心计算,时间复杂度高,难以处理高维和大规模数据.为此,基于水平截集提出一种不一致近邻加速策略.该策略跟踪论域中每个对象的模糊近邻集,持续删减其中不影响计算的近邻,若对象的不一致近邻删减至空,则删减该对象,从而提高算法效率.同时,设计一种基于不一致近邻递减的属性重要度,可有效抑制冗余特征入选,提升效率及分类精度.通过理论证明,所提的加速策略及属性重要度不影响属性入选的次序.在此基础上,提出新的模糊粗糙集特征选择算法.在9个UCI和scikit数据集上进行验证,实验结果表明,该算法不仅有效缩短运行时间,并可取得较高的分类精度,相比FA-FSCE、AVDP和IV-FS-FRS-2算法,运行时间至少可缩短9.44%,尤其在高维和大规模数据上可缩短 61.01%~99.54%,在支持向量机和K-近邻算法的分类精度上最高可分别提高11.20%和19.95%.
模糊粗糙集、特征选择、水平截集、不一致近邻、属性重要度
50
TP391(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金
2024-01-19(万方平台首次上网日期,不代表论文的发表时间)
共10页
110-119