基于约束的混合属性增量聚类算法
为解决大规模数据集聚类过程中内存容量受限问题,提出了一种基于聚类个数约束的快速聚类算法,只需扫描一趟原始数据集,半径阈值随聚类过程动态变化;同时定义了一种包含分类属性取值频率信息的类间差异性度量,可用于混合属性数据集,时间复杂度与空间复杂度同数据集大小,属性个数近似成线性关系.在KDDCUP99数据集上的实验结果表明,提出的算法输入参数少,具有良好的聚类特性,可用于大规模数据集.
混合属性、增量聚类、差异度量、大规模数据集、约束
31
TP391(计算技术、计算机技术)
国家863高技术研究发展计划基金项目2006AA01A120;国家自然科学基金项目10871040
2010-06-30(万方平台首次上网日期,不代表论文的发表时间)
共4页
1799-1801,1805