10.11772/j.issn.1001-9081.2019101708
基于图上随机游走的离群点检测算法
离群点检测算法在网络入侵检测、医疗辅助诊断等领域具有十分广泛的应用.针对LDOF、CBOF及LOF算法在大规模数据集和高维数据集的检测过程中存在的执行时间长及检测率较低的问题,提出了基于图上随机游走(BGRW)的离群点检测算法.首先初始化迭代次数、阻尼因子以及数据集中每个对象的离群值;其次根据对象之间的欧氏距离推导出漫步者在各对象之间的转移概率;然后通过迭代计算得到数据集中每个对象的离群值;最后将数据集中离群值最高的对象判定为离群点并输出.在UCI真实数据集与复杂分布的合成数据集上进行实验,将BGRW算法与LDOF、CBOF和LOF算法在执行时间、检测率和误报率指标上进行对比.实验结果表明,BGRW算法能够有效降低执行时间并在检测率及误报率指标上优于对比算法.
数据挖掘、离群点检测、马尔可夫链、随机游走、LDOF、CBOF、LOF
40
TP311.1(计算技术、计算机技术)
国家自然科学基金资助项目61862060,61462079,61562086,61562078
2020-06-02(万方平台首次上网日期,不代表论文的发表时间)
共7页
1322-1328