基于改进快速密度峰值算法的电力负荷曲线聚类分析
为解决传统聚类算法对大数据背景下高维海量、类簇形状差异巨大的电力负荷曲线进行聚类分析时存在的聚类结果不稳定、聚类效果较差、聚类速度慢和内存消耗过大等问题,提出一种改进的快速密度峰值聚类算法.首先应用主成分分析法对归一化后的负荷曲线集进行降维处理,以减少样本向量间欧式距离的计算量和加快后续操作.然后利用kd树算法对降维后的数据进行快速K近邻搜索生成KNN矩阵.最后以KNN矩阵代替原算法的距离矩阵作为输入数据.在基于KNN改进的样本局部密度和距离计算准则的基础上,运用快速密度峰值算法对负荷曲线进行聚类分析.通过实验和算例分析验证了所提改进算法的实用性和有效性.
电力大数据、负荷曲线聚类、快速密度峰值算法、主成分分析、kd树、KNN算法
46
国家高技术研究发展计划863 计划2015AA050203;国家电网公司科技项目"智能配用电大数据应用关键技术深化研究"
2018-11-28(万方平台首次上网日期,不代表论文的发表时间)
共9页
85-93