10.3969/j.issn.1007-130X.2010.08.026
一种高维数据聚类遗传算法
聚类分析是数据挖掘中的一个重要研究课题.在许多实际应用中,聚类分析的数据往往具有很高的维度,例如文档数据、基因微阵列等数据可以达到上千维,而在高维数据空间中,数据的分布较为稀疏.受这些因素的影响,许多对低维数据有效的经典聚类算法对高维数据聚类常常失效.针对这类问题,本文提出了一种基于遗传算法的高维数据聚类新方法.该方法利用遗传算法的全局搜索能力对特征空间进行搜索,以找出有效的聚类特征子空间.同时,为了考察特征维在子空间聚类中的特征,本文设计出一种基于特征维对子空间聚类贡献率的适应度函数.人工数据、真实数据的实验结果以及与k-means算法的对比实验证明了该方法的可行性和有效性.
高维数据聚类、遗传算法、特征子空间
32
TP301.6(计算技术、计算机技术)
广东省自然科学基金资助项目8151503101000016
2010-11-03(万方平台首次上网日期,不代表论文的发表时间)
共4页
94-97