基于结构相似度的大规模社交网络聚类算法
针对社交网络的有向交互性和大规模特性,该文提出一种基于结构相似度的有向网络聚类算法(DirSCAN),以及相应的分布式并行算法(PDirSCAN)。考虑社交网络中节点间的有向交互性,将行为结构相似的节点聚集起来,并进行节点功能分析。针对社交网络规模巨大的特点,提出MapReduce框架下的分布式并行聚类算法,在确保聚类结果一致的前提下,提高处理性能。大量真实数据集上的实验结果表明,DirSCAN比无向网络聚类算法(SCAN)在F1上可提高2.34%的性能,并行算法PDirSCAN比DirSCAN运行速度提升1.67倍,能够有效处理大规模的有向网络聚类问题。
社交网络、有向网络聚类、并行算法、MapReduce
TP393(计算技术、计算机技术)
国家自然科学基金61105049,61300166;中国民航信息技术科研基地开放课题基金CAAC-ITRB-201303, CAAC-ITRB-201204;天津市科技计划项目13ZCZDGX01098;天津市自然科学基金14JCQNJC00600资助课题
2015-03-09(万方平台首次上网日期,不代表论文的发表时间)
共6页
449-454