10.3969/j.issn.1002-137X.2011.10.040
一种基于加权KNN的大数据集下离群检测算法
传统KNN算法是在基于距离的离群检测算法的基础上提出的一种在大数据集下进行离群点挖掘的算法,然而KNN算法只以最近的第k个邻居的距离作为判断是否是离群点的标准有时也失准确性.给出了一种在大数据集下基于KNN的离群点检测算法,即在传统KNN方法的基础上为每个数据点增加了权重,权重值为与最近的k个邻居的平均距离,离群点为那些与第k个邻居的距离最大且相同条件下权重最大的点.算法能提高离群点检测的准确性,通过实验验证了算法的可行性,并与传统KNN算法的性能进行了对比.
离群点、数据挖掘、权重、划分
38
TP391(计算技术、计算机技术)
国家自然科学基金项目61073058
2012-02-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
177-180