10.3969/j.issn.1001-3695.2014.06.021
基于密度的局部离群数据挖掘方法的改进
针对传统局部离群点检测算法的局限性进行了研究,提出了一种新的有效的离群数据挖掘算法.该算法在寻找数据点的近邻区域时采用了基于影响空间的局部离群点检测(INFLO)中影响空间的概念,然后在计算数据点的离群因子时,根据基于链接的离群点检测(COF)中链式距离的思想,提出了基于相似k距离邻居序列(SKDNS)的离群因子计算方法.通过对比该算法和其他经典局部离群点检测算法在不同数据分布情况下的挖掘结果,该算法比LOF、INFLO和COF算法的离群挖掘准确性更高,能有效克服LOF算法的不足,提高局部离群数据挖掘的准确性和多样性.
离群数据挖掘、影响空间、链式距离、相似k距离邻居序列、离群因子
31
TP311.13;TP391(计算技术、计算机技术)
2014-07-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
1693-1696,1701