DOI：10.3969/j.issn.1673-629X.2017.06.009

基于多叉树确定K值的动态K-means聚类算法

引用

摘要：

K-means聚类算法是基于划分的经典聚类算法之一,因其简洁、高效得到了广泛的应用.K-means算法具有容易实现、时间和空间复杂度较小的优点.但该算法的初始聚类数K通常不能通过有效的手段事先确定,其初始聚类中心往往是随机选取的,易收敛于局部最优解,造成聚类结果的不准确.基于多叉树确定K值的动态K-means聚类算法是对传统算法的改进,力求在迭代过程中动态分裂合并簇来确定最合理的聚类数,并且能在一定程度上解决聚类结果收敛于局部最优解的问题.文中还探索了相应的数据模型以支持所改进算法的研究,并从横向与纵向两方面与二分K-means算法作了对比实验.实验结果表明,改进后的K-means算法不依赖于全局数据集,更适用于分布式平台运算;算法相对效率随着数据集规模的增大,特别是在洪量数据集下具有明显的优势.

关键词：K-means、聚类、分裂、合并、多叉树

所属期刊栏目：27

分类号：TP301.6(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目61171053;南京邮电大学基金SG1107

在线出版日期：2017-07-12（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：41-45,50

英文信息展示

期刊专题