10.3969/j.issn.1000-1220.2018.01.012
空间密度相似性度量K-means算法
传统K-means算法的缺陷有初始聚类中心选择的不稳定、聚类效果对初始聚类中心过于依赖、非簇型数据集分类效果不佳等问题.为克服以上不足,本文提出空间密度相似性度量K-means算法.该算法采用可伸缩空间密度的相似性距离度量数据点间的相似度,并将密度和距离共同作为选择新初始聚类中心的相关因子,以及根据类内距离进行迭代的一种新的类中心迭代模型.在非簇型人工数据集和UCI标准数据集上的实验证明,与传统及其他改进K-means算法相比,本文提出的算法可得到更加合理的初始聚类中心,能反映任意形状的复杂数据集分布规律,算法更加稳定、准确.
K-means、非簇型、初始聚类中心、相似性度量
39
TP311(计算技术、计算机技术)
中央高校基本科研业务费专项基金项目KYZ201668;国家科技支撑计划课题项目2015BAK36B05;江苏省科技厅产学研前瞻性研究项目BY2015012-01
2018-01-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
53-57