10.3969/j.issn.1673-4785.201411011
一种基于内存计算的电力用户聚类分析方法
随着智能电表与采集终端采集的用电数据迅猛增长,传统数据分析方法已经不能满足大数据环境下智能用电行为分析的需要。鉴于K-means算法具有计算效率高、容易并行化等特点,采用弹性分布式数据集与并行内存计算框架对其进行改进与并行化,减少作业的运行与输入输出操作时间,提高聚类分析的处理能力。对用电测量数据进行预处理构建实验数据集,实验结果表明本方法对电力用户聚类分析的准确率高于单机K-means方法,其处理速度和能力明显优于单机和基于MapReduce并行计算框架的聚类方法,并对数据的增长具有较好的适应性。
大数据、智能用电、弹性分布式数据集、内存计算、聚类分析
TP18(自动化基础理论)
国家自然科学基金资助项目61074078;中央高校基本科研业务费专项资金资助项目12MS113.
2015-09-10(万方平台首次上网日期,不代表论文的发表时间)
共8页
569-576