10.11896/j.issn.1002-137X.2019.03.046
基于两种子结构感知的社交网络Graphlets采样估计算法
graphlets是指大规模网络中节点数目较少的连通诱导子图,在社交网络和生物信息学领域有着广泛的应用.由于精确计数的计算成本较高,目前大多采用随机游走采样算法来近似估计graphlets的频率.随着节点数目的增多,graphlets的种类数增长迅速且结构变化复杂,快速估计大规模网络中所有种类的graphlets的频率是一项挑战.文中提出了基于两种子结构的随机游走采样算法CSRW2来估计graphlets频率,即给定graphlets节点数k(k=4,5),通过采样k-graphlets的子结构(k-1)-path和3-star得到两种样本,之后用比例放大法综合,以高效估计graphlets并适应graphlets结构的复杂变化.实验结果表明,CSRW2能以统一的框架估计所有k-graphlets类型的频率,其估计精度优于现有代表性算法,更适用于频率较低且结构较稠密的graphlets.例如,用CSRW2估计真实网络sofb-Penn94中的5-graphlets,当样本数为2万时,标准均方根误差的平均值由WRW算法的0.8降低至CSRW2算法的0.22左右.
社交网络、Graphlet、Graphlet频率、随机游走、采样算法、无偏估计
46
TP393(计算技术、计算机技术)
国家自然科学基金面上项目61672486
2019-05-24(万方平台首次上网日期,不代表论文的发表时间)
共7页
314-320