DOI：10.3969/j.issn.1001-3695.2017.08.014

引入信息熵的CURE聚类算法

引用

摘要：

为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进.该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数据的分布;在高、低层聚类阶段,采取不同的选取策略,分别选取相应的代表点.在UCI和人造数据集上的实验结果表明,提出的算法在一定程度上提高了聚类的准确率,且在大型数据集上比传统CURE算法有着更高的聚类效率.

关键词：层次聚类、CURE算法、信息熵、代表点选取

所属期刊栏目：34

分类号：TP301.6(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目41571396

在线出版日期：2017-08-16（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：2303-2305

英文信息展示

期刊专题