10.3969/j.issn.1000-3428.2007.24.020
基于分治法的高维大数据集模糊聚类算法
将高维的大数据集随机分成若干个子集,对每个子集聚类采用一种基于遗传算法的高维数据模糊聚类方法.该方法引入了一个模糊非相似矩阵来表示高维样本之间的非相似程度,并将高维样本随机初始化到二维平面,利用遗传算法迭代优化二维样本的坐标值,实现二维样本之间的欧氏距离向样本间的模糊非相似度的趋近.将得到的最优的二维样本用模糊C-均值聚类(FCM)算法聚类,克服了聚类有效性对高维样本空间分布的依赖.实验仿真表明,该算法有较好的聚类效果,且极大地提高了聚类的速度.
模糊聚类、分治法、遗传算法、模糊非相似矩阵、大数据集、高维
33
TP18(自动化基础理论)
国家科技部高新技术计划资金资助项目2005EJ000017;河北省科技研究与发展计划基金02547015D;河北省普通高等学校博士科研资金资助项目B2002118
2008-03-10(万方平台首次上网日期,不代表论文的发表时间)
共3页
60-62