10.3969/j.issn.1001--3695.2016.11.040
基于角度方差的多层次高维数据异常检测算法
异常检测一直是数据挖掘领域的重要工作之一。基于欧氏距离的异常检测算法在应用于高维数据时存在检测精度无法保证和运行时间过长的问题。在基于角度方差的异常检测算法基础上,提出了一种多层次的高维数据异常检测算法(hybrid outlier detection algorithm based on angle variance for high-dimensional data,HODA)。算法结合了粗糙集理论,分析属性之间的相互作用以排除影响较小的属性;通过分析各维度上的数据分布,对数据进行网格划分,寻找可能存在异常点的网格;最后对可能存在异常点的网格计算角度方差异常因子,筛选异常数据。实验结果表明,与ABOD、FastVOA和经典LOF算法相比,HODA算法在保证精测精度的前提下,运行时间显著缩短,且可扩展性强。
高维数据、异常检测、降维、网格、角度方差
33
TP301.6(计算技术、计算机技术)
中国民航大学中国民航信息技术科研基地资质项目CCAC-ITRB-201301
2016-11-30(万方平台首次上网日期,不代表论文的发表时间)
共4页
3383-3386