10.3969/j.issn.1007-130X.2017.02.003
基于Isolation Forest的并行化异常探测设计
异常探测具有广泛的应用,受到了工业界和学术界的共同关注.在众多异常探测方法中,Isolation Forest算法具有执行效率高、探测准确度好的特点,获得了众多应用.但是,传统Isolation Forest算法难以处理大规模数据.为解决此问题,设计了一种基于云计算平台的算法.具体地,使用Hadoop分布式存储系统和MapReduce分布式计算框架设计并实现了基于Isolation Forest的并行化异常探测算法PIFH.通过将探测模型构建和数据异常评价的过程并行化,提升了PIFH算法探测异常的执行效率,扩展了其应用范围.利用真实世界数据集验证了所提算法的执行效率和可扩展性.
异常探测、云计算、并行化
39
TP391(计算技术、计算机技术)
国家自然科学基金61572332,61379032;中国博士后科学基金特别资助2016T90850;中央高校基本科研业务费2016SCU04A22
2017-04-10(万方平台首次上网日期,不代表论文的发表时间)
共9页
236-244