10.3969/j.issn.1001-3695.2017.08.014
引入信息熵的CURE聚类算法
为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进.该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数据的分布;在高、低层聚类阶段,采取不同的选取策略,分别选取相应的代表点.在UCI和人造数据集上的实验结果表明,提出的算法在一定程度上提高了聚类的准确率,且在大型数据集上比传统CURE算法有着更高的聚类效率.
层次聚类、CURE算法、信息熵、代表点选取
34
TP301.6(计算技术、计算机技术)
国家自然科学基金资助项目41571396
2017-08-16(万方平台首次上网日期,不代表论文的发表时间)
共3页
2303-2305