基于累积全熵的子空间聚类离群点检测算法
针对累积互信息方法存在的最佳聚类子空间选择不稳定和计算复杂的问题,给出累积熵的链式法则、累积全相关、累积全熵的计算方法,采用累积全熵在连续数据集上挖掘最佳聚类子空间,并在最佳聚类子空间中进行离群点挖掘,提出基于累积全熵的子空间聚类离群点检测算法.分别在真实数据集和虚拟数据集上验证了所提算法的有效性和可伸缩性.实验表明,所提算法进一步提高了子空间离群点的挖掘效率.
大数据分析、离群点检测、子空间聚类、累积全熵
21
TP39(计算技术、计算机技术)
河北省自然科学基金资助项目F2012203087;国家自然科学基金资助项目61272124,61073063.Project supported by the Hebei Provincial Natural Science Foundation,ChinaF2012203087;the National Natural Science Foundation,China61272124,61073063
2015-09-30(万方平台首次上网日期,不代表论文的发表时间)
共8页
2249-2256