10.3969/j.issn.1007-757X.2012.06.003
基于云计算的物联网数据挖掘
物联网是一个巨大的、分布广泛的物与物相连的网络,其上产生的海量数据通常是与时间和空间相关的,具有动态、异构、分布的特性,因此对这些数据的挖掘非常困难,而且耗费时间和内存,效率低下.为了解决这些问题,提出了一种基于云计算的物联网数据挖掘系统:将这些海量数据转化为PML数据文件,并存储在HDFS中,同时把挖掘任务分配到多台节点服务器上并行处理.采用Hadoop平台,将关联规则Apriori算法Map/Reduce化,提高了挖掘的效率.另外,采用副本策略将计算向存储迁移,将失效节点的计算迁移到副本数据存储节点就地执行,降低了数据传输的时间,大为提高了挖掘的效率.
云计算、物联网、数据挖掘、Map/Reduce、关联规则、副本策略
28
TP393(计算技术、计算机技术)
浙江省自然科学基金Y1101269.科技计划项目2008C11106-2
2012-11-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
10-13