基于IK-means的用电行为研究
为了提高K-means算法的聚类精度和海量数据下的运行效率,提出了基于Spark的并行化IK-means算法.采用熵值法确定传统密度峰值算法(DPC)的截断距离,并用于选择K-means算法的初始聚类中心,获得最佳聚类数量K,记作IK-means算法.UCI聚类数据对比显示,两组实验中,IK-means算法比K-means算法的准确率分别提高了25.22%和31.65%;在电力用户用电行为分析上,基于Spark的并行化IK-means算法的聚类精度达到了93%,验证了所提方法的有效性.
用电行为、K-means、密度峰值算法、Spark
39
TP311(计算技术、计算机技术)
2020-05-11(万方平台首次上网日期,不代表论文的发表时间)
共5页
54-58