10.3969/j.issn.1000-1220.2018.05.043
采用分布式DBSCAN算法的用电行为分析
作为描述电网运营状态的重要依据,用户实时用电量数据在各时间段内的均值、方差及离散傅里叶变换(DFT)分量等统计变换结果是用电行为特征提取的重要建模参数.基于密度聚类的DBSCAN算法能够对空间内样本点进行更加准确可靠的类别划分.层次聚类的子域划分、域内聚类和聚类合并的过程为DBSCAN算法的分布式实现提供重要参考.根据DBSCAN算法中的密度参数,保留各子簇的边界特征样本,使子簇合并过程的计算效率进一步提高.以Spark为代表的分布式内存计算系统将数据处理的中间结果存入内存,降低读写开销,为大规模数据的迭代分析提供快捷高效的处理环境.实验结果证明,在内存计算系统中实现的分布式DBSCAN聚类算法能够准确高效的实现大规模用户用电行为分析.
行为提取、层次聚类、簇边界特征、分布式内存计算
39
TP391(计算技术、计算机技术)
辽宁电力公司科技项目SGLNXT00DKJS1600242
2018-07-11(万方平台首次上网日期,不代表论文的发表时间)
共5页
1108-1112