基于K-means稳定划分和贝叶斯连接性的聚类
K-means只能处理球形或具有较好分离度的数据集,不能够处理任意形状的数据集.同时,因为初始中心点是随机选择的,所以K-means聚类结果是不稳定的.为此提出一个新的聚类算法.具体如下:首先用K-means对数据集进行多次划分,计算点对出现在同一个类的频数,辨识并丢弃噪声点,从而获得精炼的类.然后重新分配那些点个数较少的类及分割距离方差较大的类,得到稳定的类.再用基于贝叶斯的连接性准则合并稳定的类,以生成用户指定个数的类.最后,把丢弃的噪声点分配给其最近邻的类.在一些人工数据集上做了实验,提出的聚类方法准确率较原始的K-means及其他传统的方法,如DBSCAN,Sin-gle-linkage有显著的提高.
K-means、噪声点、重新分配、稳定的类、基于贝叶斯的连接性
37
TP391(计算技术、计算机技术)
国家自然科学基金项目61175054
2016-10-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
763-767