10.3969/j.issn.1003-3254.2011.01.017
基于KD树子样的聚类初始化算法
在处理大数据集聚类初始化问题时,随机子样法是一种重要的数据约简操作.对随机取样的过程、特征及缺陷进行了分析,提出一种基于KD树子样的聚类初始化方法.该方法利用KD树将样本空间以递归方式细分成多个子空间,并分别在各子空间中随机取样形成KD树子样,有效避免了随机子样分布有偏的不足,使得子样中好的聚类初始点也能很好的表达整个数据集的聚类结构.仿真结果表明,该方法选择的聚类初始点更加接近期望的聚类中心,能获得更高的聚类精度.
聚类初始化、KD树、子样、K均值算法
20
TP3;TN9
2011-04-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
80-83