10.3969/j.issn.1000-7024.2013.04.027
基于结合内容特征的TrustRank算法改进
垃圾网页在利益的驱使下采用作弊手段欺骗搜索引擎获得更高的排名,干扰了用户对信息的获取.通过分析网页内容特征及其分布,提出了结合内容特征信息与TrustRank算法的方法对垃圾网页进行检测.实验结果表明,结合了内容特征信息的TrustRank算法能够有效的检测出垃圾网页.
垃圾网页、搜索引擎、网页排名、信任指数、内容特征
34
TP391(计算技术、计算机技术)
国家自然科学基金项目61170145;教育部高等学校博士点专项基金项目20113704110001;山东省自然科学基金和科技攻关计划基金项目ZR2010FM021、2008B0026、2010G0020115
2013-05-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
1276-1279,1330