10.3969/j.issn.1000-3428.2016.02.030
基于用户行为与页面分析的改进PageRank算法
在经典PageRank算法中,页面的转移概率平均分配到链出页面,由于新网页的链接较少,其PR值普遍较低.经典PageRank算法通过链接计算PR值,未考虑到网页的内容,存在主题漂移现象.针对上述问题,引入网页权威因子和时间因子,通过网页按关键字检索后被点击的次数进行统计,根据其在初始排序结果中的位置对网页的PR值进行迭代修正,返回一个新的排序结果并分析网页内容,采用改进的TD-IDF算法解决网页相关性,避免主题漂移现象.仿真实验结果表明,改进算法可以提高网页排名的质量,使相关度较高的网页通过人们的自主选择获得不同程度的加权,获得加权的网页在检索结果中的排名得到提升,从而提高用户需求网页的查准率.
权威因子、时间因子、主题漂移、转移概率、PR值
42
TP391(计算技术、计算机技术)
2016-05-11(万方平台首次上网日期,不代表论文的发表时间)
共5页
164-168