10.3979/j.issn.1673-825X.2014.06.020
基于信息熵的符号属性精确赋权聚类方法
对符号类型数据聚类时,一些常用算法通常随机选择初始聚类中心,然而随机选择的中心与实际类中心可能存在较大偏差,因此,会导致聚类迭代次数的增加及聚类精度上的不足.提出一种基于信息熵对符号属性进行赋权的新方法,新方法改进了以往提出的对象密度概念及计算方法,从而弥补了以往方法在计算对象密度时没有区分每个属性在计算密度时的贡献度,从而可能选择密度大的边界点作为聚类中心,影响聚类效果的不足.提出的新方法优化了初始聚类中心的选择,一些高质量的聚类中心被选出用于聚类.最后通过Matlab编程实现新方法的聚类过程.实验显示,新方法聚类的结果在一些指标上要好于已有方法.
对象密度、边界点、信息熵、属性赋权、初始聚类中心
26
TP181(自动化基础理论)
国家自然科学基金61272420;江苏省基础研究计划自然科学BK2011022;The National Natural Science Foundation of China61272420;The Basic Research Plan of JiangsuNatural Science Foundation:BK2011022
2016-01-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
850-855