一种影响空间下的快速K-means聚类算法

引用

摘要：

K-means是一种经典的迭代划分聚类算法,但在每次迭代过程中,需要计算和比较每个数据点与所有中心点之间的距离,因此聚类过程时间开销大.利用影响空间数据结构,给出一种快速K-means聚类算法.该算法首先,引入影响空间数据结构对给定数据集进行区域划分,获得各个区域中的代表数据点;然后,对代表数据点进行K-means聚类,得到的代表数据点所属的类别即是该区域中所有数据点所属的类别,有效地降低迭代过程中的数据量,提高了聚类效率;最后,理论分析和实验结果表明,仅对代表性数据点而非数据集中所有数据点进行迭代聚类,能够在保证聚类质量的前提下,有效地提高聚类效率.

关键词：聚类、影响空间、区域划分、代表元素

所属期刊栏目：37

分类号：TP311(计算技术、计算机技术)

资助基金：国家自然科学基金项目41372349;山西省社会发展攻关项目20140313023-2;山西省高校优秀青年学术带头人项目资助

在线出版日期：2016-10-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：2060-2064

英文信息展示

期刊专题