10.3969/j.issn.1000-3428.2011.19.026
基于信息熵降维的混合属性数据流聚类算法
现有的数据流聚类算法无法处理高维混合属性的数据流.针对该问题,对HPStream算法的脱机聚类和联机聚类过程进行改进,利用频度矩阵处理名词属性,通过基于信息熵的名词属性选择方法降低数据维度.实验结果表明,该算法能有效处理混合属性和维度较高的数据集,与HPStream算法相比,聚类精度有5%~15%的提高.
数据流挖掘、混合属性、频度矩阵、信息熵、降维
37
TP311(计算技术、计算机技术)
2012-02-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
82-84,87