基于高斯过程的CLIQUE改进算法
CLIQUE聚类算法从任意密集网格进行深度优先遍历生成聚类簇时性能不足,因为当聚类数据集大且噪声较多时,大量密集网格不属于任何聚类簇。基于高斯随机采样有较好的收敛性,能快速找到密度局部最大的密集网格,提出了一种基于高斯过程的CLIQUE改进算法GP-CLIQUE。该算法识别密集网格后,先在密集网格空间的每一维上进行高斯随机采样快速找到密度局部最大的密集网格;再分别从这些密度局部最大的密集网格进行深度优先遍历生成聚类簇;最后确定每个聚类簇的最小覆盖。实验结果表明,在数据集小且无噪声时,该算法在性能上与CLIQUE相当,当数据集大噪声较多时,其性能较CLIQUE能提高6%~24%。
CLIQUE、高斯过程、聚类簇、密集网格、深度优先遍历、局部最大密度、高斯随机采样
TP301(计算技术、计算机技术)
四川省科技支撑计划项目2014GZ0013。
2016-01-07(万方平台首次上网日期,不代表论文的发表时间)
共4页
85-87,92