分布式并行FP-growth算法在二次设备缺陷监测中的应用
智能变电站设备监控数据存储分散,主站获取设备缺陷特征的难度大,有必要通过分布式数据挖掘的方法发现设备缺陷和信号之间的关系.分布式并行频繁模式树(FP-growth)算法采用Hadoop框架和Mapreduce算法,能够快速有效地发现信号间的强关联关系.针对二次设备的缺陷特征,建立异常模型,提出遥信历史数据准备和清洗方法,滤除复归、抖动等噪声信号,并将字符串数据转换为以关键字为标识的事务数据项集.在此基础上采用分布式并行FP-growth算法挖掘各变电站历史数据库异常信号的频繁项集和强关联关系.应用结果表明,该方法能够有效地发现二次设备的频发异常,找到诱发异常的缺陷,为家族性缺陷的认定提供数据基础.
分布式并行频繁模式树、数据挖掘、关联规则、频发异常、家族性缺陷
49
TP311;TP277;F274
国家重点研发计划2018YFB21002
2021-06-02(万方平台首次上网日期,不代表论文的发表时间)
共8页
160-167