10.3772/j.issn.1000-0135.2012.08.008
基于百度指数的网页用户关注度研究
针对海量的互联网信息,提出一种计算网页理论用户关注度的方法,以期提高网络信息搜索的效率,改进搜索排名的准确性.本文以中文论坛的新闻网页为研究对象,利用百度指数提供的用户搜索信息,通过正文抽取、特征项提取、关注度计算等步骤,实现面向内容分析的网页理论用户关注度的计算,最后对150条网页进行实验和回归分析.结果表明,特征词提取的最佳个数为3,理论用户关注度与实际用户关注度(点击量)的相关系数达0.8以上,说明该方法具有一定的准确性.
用户关注度、百度指数、网页特征项、回归分析
31
G25;TP3
国家自然科学基金资助项目70971099;中央高校基本科研业务费专项资金资助
2012-10-15(万方平台首次上网日期,不代表论文的发表时间)
共9页
837-845