10.3969/j.issn.1002-137X.2013.10.039
MR-GSpar:一种基于MapReduce的大图稀疏化算法
图的稀疏化是图聚类分析中数据预处理的关键操作,已得到广泛的关注.针对图数据日益普及、规模不断增大的现状,提出了一种基于MapReduce的面向大规模图的稀疏化算法,即MR-GSpar算法.该算法在MapReduce并行计算框架的基础上,通过对传统的最小哈希(Minhash)算法的并行化改造,使其可在分布式的集群环境中实现对大规模图数据的高效稀疏化处理.真实数据集上的实验表明了该算法的可行性与有效性.
图稀疏化、Minhash、MapReduce框架、MR-GSpar算法
40
TP3111(计算技术、计算机技术)
国家自然科学基金项目61070031,61070032
2013-11-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
190-193,212