10.3969/j.issn.1672-4291.2012.04.005
基于邻域的K中心点聚类算法
提出一种基于邻域的K中心点聚类算法,该算法利用数据集样本的自然分布信息定义数据对象的邻域半径和相应邻域,选择位于样本分布密集区且相距较远的K个数据对象作为初始聚类中心,以期改进快速K中心点算法在选取初始中心点时有可能使多个初始中心位于同一类簇的潜在缺陷.通过UCI机器学习数据库数据集以及随机生成的带有噪音点的人工模拟数据集实验测试,表明提出的基于邻域的K中心点算法不仅具有很好的聚类效果,而且运行时间短,对噪音数据有很强的抗干扰性能,优于传统K中心点算法和Park等人的快速K中心点算法.
邻域、K中心点算法、样本密度、聚类、样本空间分布
40
TP181(自动化基础理论)
陕西省自然科学基础研究计划项目2010JM3004;中央高校基本科研业务费专项资金重点项目GK201102007
2012-09-29(万方平台首次上网日期,不代表论文的发表时间)
共7页
16-22