一种影响空间下的快速K-means聚类算法
K-means是一种经典的迭代划分聚类算法,但在每次迭代过程中,需要计算和比较每个数据点与所有中心点之间的距离,因此聚类过程时间开销大.利用影响空间数据结构,给出一种快速K-means聚类算法.该算法首先,引入影响空间数据结构对给定数据集进行区域划分,获得各个区域中的代表数据点;然后,对代表数据点进行K-means聚类,得到的代表数据点所属的类别即是该区域中所有数据点所属的类别,有效地降低迭代过程中的数据量,提高了聚类效率;最后,理论分析和实验结果表明,仅对代表性数据点而非数据集中所有数据点进行迭代聚类,能够在保证聚类质量的前提下,有效地提高聚类效率.
聚类、影响空间、区域划分、代表元素
37
TP311(计算技术、计算机技术)
国家自然科学基金项目41372349;山西省社会发展攻关项目20140313023-2;山西省高校优秀青年学术带头人项目资助
2016-10-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
2060-2064