重要度集成的属性约简方法研究
启发式算法在求解约简的过程中逐步加入重要度最高的属性,但其忽视了数据扰动将会直接引起重要度计算的波动问题,从而造成约简结果的不稳定.鉴于此,提出了一种基于集成属性重要度的启发式算法框架.首先,在原始数据上进行多重采样;然后,在每次循环过程中分别计算各个采样结果上的属性重要度并对这些重要度进行集成;最后,将集成重要度最大的属性加入到约简中去.利用邻域粗糙集方法进行的实验结果表明,基于集成重要度的属性约简算法不仅能够获取更加稳定的约简,而且利用所生成的约简能够得到一致性较高的分类结果.
属性约简、分类、聚类、数据扰动、集成、启发式算法、邻域粗糙集、稳定性
13
TP391(计算技术、计算机技术)
国家自然科学基金项目61572242,61503160,61502211;江苏省高校哲学社会科学基金项目2015SJD769;中国博士后科学基金项目2014M550293
2018-06-11(万方平台首次上网日期,不代表论文的发表时间)
共8页
414-421