10.3969/j.issn.1006-2475.2017.05.013
一种基于改进KNN的大数据离群点检测算法
针对KNN算法在大数据离群点检测领域中难以处理高维数据和时间复杂度过高的这2个缺点,提出一种基于AOR(属性重叠率)的分类方法,并对KNN算法进行改进.首先对数据进行基于AOR的降维处理,使得数据可处理维度大大增加,然后对传统的KNN算法进行剪枝改进,减少了大量的无效计算.实验结果表明,本文算法对维度高、容量大的大数据样本在运行效率、准确度等方面有较大的提升.
大数据、KNN、降维、属性重叠率、剪枝
TP311(计算技术、计算机技术)
四川省科技厅科技支撑计划项目2013GZ0141
2017-06-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
67-70,75