10.3969/j.issn.0258-2724.2011.03.017
基于中心性和PageRank的网页综合评分方法
为准确、高效地对网页进行评分,提出了一种基于中心性(结点度、居间度和紧密度)和PageRank算法的网页评分方法CentralRank.它采用PageBank算法计算网页分数,借助中心性度量的方法计算页面在Web社会网络中的重要性.为了验证CentralRank的性能优势,设计了一个网页抓取器,可利用该抓取器自动、准确地下载网页信息.该网页抓取器集成了网络信息采集、页面内容分析和页面消重3项技术.基于大量真实数据的实验结果表明:CentralRank在保证网页评分时间性能的前提下,比单纯基于中心性的网页评分算法和PageBank算法更准确、有效,预测准确性分别提高约14.2%和7.5%.
社会网络分析、Web社会网络、中心性、PageRank算法、网页评分
46
TP311.13(计算技术、计算机技术)
中国博士后科学基金资助项目20090461346;中央高校基本科研业务费专项资金资助项目SWJTU09CX035;教育部人文社会科学研究青年基金资助项目10YJCZH117;四川省青年科技基金资助项目08ZQ026-016;四川省科技支撑计划项目2010GZ0123
2011-09-22(万方平台首次上网日期,不代表论文的发表时间)
共5页
456-460