DOI：10.3969/j.issn.1000-1220.2018.01.012

空间密度相似性度量K-means算法

引用

摘要：

传统K-means算法的缺陷有初始聚类中心选择的不稳定、聚类效果对初始聚类中心过于依赖、非簇型数据集分类效果不佳等问题.为克服以上不足,本文提出空间密度相似性度量K-means算法.该算法采用可伸缩空间密度的相似性距离度量数据点间的相似度,并将密度和距离共同作为选择新初始聚类中心的相关因子,以及根据类内距离进行迭代的一种新的类中心迭代模型.在非簇型人工数据集和UCI标准数据集上的实验证明,与传统及其他改进K-means算法相比,本文提出的算法可得到更加合理的初始聚类中心,能反映任意形状的复杂数据集分布规律,算法更加稳定、准确.

关键词：K-means、非簇型、初始聚类中心、相似性度量

所属期刊栏目：39

分类号：TP311(计算技术、计算机技术)

资助基金：中央高校基本科研业务费专项基金项目KYZ201668;国家科技支撑计划课题项目2015BAK36B05;江苏省科技厅产学研前瞻性研究项目BY2015012-01

在线出版日期：2018-01-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：53-57

英文信息展示

期刊专题