基于爬虫的用户迁徙网络的设计与实现
在传统的互联网中,往往是由节点表示网站,节点之间的边表示两个网站之间有物理链接。由于直观的反应了网络状态,这种网络模型得到了广泛的应用。但当研究一些基于网络的高级应用如探讨用户访问网络、在各网站间的分布情况时,传统的互联网有其局限性。本文尝试研究不同网站之间的共同用户如何进行“网络迁徙”。我们使用爬虫搜集网络中的信息,构建了一个“用户迁徙”网络:网络中的节点代表网站,两个节点之间有边表示在一段时间内这两个网站有相同的用户访问,节点之间的权值代表了一段时间内可能访问这两个网站的共同用户的数量。这种用户迁徙网络不仅可以使我们了解互联网中用户的兴趣分布,而且还可以作为研究平台广泛应用于搜索或者网络广告投放研究等方面。
用户迁徙网络、网络爬虫、网络属性
TP393.02(计算技术、计算机技术)
河南省教育厅科学技术研究重点项目12B520071;郑州市科技发展计划项目攻关计划。
2013-10-10(万方平台首次上网日期,不代表论文的发表时间)
共5页
137-141