10.3969/j.issn.1006-4303.2018.03.015
基于区间数的不确定数据流2κ近邻聚类算法
现有数据流聚类算法多数面向的是确定性数据,可是不确定数据的数据流聚类逐步被受到关注,因为经典的不确定数据聚类算法具有概率密度函数获取困难、实用性不强以及计算复杂等缺点,提出一种基于区间数的不确定数据流聚类算法 UIDStream.算法用区间数来表示属性不确定性数据和基于区间数的距离计算方法,定义了不确定性数据之间的相似度,并利用传统 κ近邻聚类的思想,提出基于区间数的2κ近邻微簇和最优2κ近邻微簇的概念,通过最优2κ近邻微簇的融合,实现不确定数据流的聚类.实验结果表明:改进后的算法具有良好的聚类效果,提高了不确定数据流聚类的聚类质量和速率.
不确定数据、区间数、数据流聚类、数据挖掘
46
TP3(计算技术、计算机技术)
水利部公益性行业科研专项201401044
2018-06-15(万方平台首次上网日期,不代表论文的发表时间)
共6页
321-326