基于MapReduce的微博用户搜索排名算法
在微博搜索领域,单纯依赖于粉丝数量的搜索排名使刷粉行为有了可乘之机,通过将用户看作网页,将用户间的“关注”关系看作网页间的链接关系,使PageRank关于网页等级的基本思想融入到微博用户搜索,并引入一个状态转移矩阵和一个自动迭代的MapReduce工作流将计算过程并行化,进而提出一种基于MapReduce的微博用户搜索排名算法.在Hadoop平台上对该算法进行了实验分析,结果表明,该算法避免了用户排名单纯与其粉丝数量相关,使那些更具“重要性”的用户在搜索结果中的排名获得提升,提高了搜索结果的相关性和质量.
微博搜索、云计算、MapReduce编程模型、Hadoop平台/系统、PageRank算法
32
TP391.3(计算技术、计算机技术)
北京市科学技术研究院萌芽计划基金
2012-12-24(万方平台首次上网日期,不代表论文的发表时间)
共5页
2989-2993