10.3969/j.issn.2095-2716.2016.01.013
基于改进K-means算法的商业用户聚类分析
在竞争激烈的市场环境下,为了更好分析商业用户信息,赢得更多的商业用户,需要进行海量大数据分析.本文针对传统K-means算法自身初始聚类选取的缺陷和单机串行聚类算法的局限性,提出了一种改进的K-means聚类算法.结合当前主流的开源云计算平台Ha-doop,把改进的算法并行化,克服了传统串行聚类算法在海量数据处理时的不足,以某大型网络存储服务企业每日商业用户网络存储资源使用量为实验数据,验证了算法的高效性和可行性.
K-means聚类算法、云计算、商业用户、网络存储资源
38
TP391.4(计算技术、计算机技术)
河北省自然科学基金ZD2014077
2016-06-03(万方平台首次上网日期,不代表论文的发表时间)
共5页
67-71