10.3969/j.issn.1673-629X.2011.02.016
K-Means聚类算法的研究
K-Means算法是一种经典的聚类算法,有很多优点,也存在许多不足.比如初始聚类数K要事先指定,初始聚类中心选择存在随机性,算法容易生成局部最优解,受孤立点的影响很大等.文中主要针对K-Means算法初始聚类中心的选择以及孤立点问题加以改进,首先计算所有数据对象之间的距离,根据距离和的思想排除孤立点的影响,然后提出了一种新的初始聚类中心选择方法,并通过实验比较了改进算法与原算法的优劣.实验表明,改进算法受孤立点的影响明显降低,而且聚类结果更接近实际数据分布.
K-Means算法、初始聚类中心、孤立点
21
TP301.6(计算技术、计算机技术)
安徽省教育科研重点项目KJ2009A57
2011-06-14(万方平台首次上网日期,不代表论文的发表时间)
共4页
62-65