10.3969/j.issn.1007-757X.2007.04.009
一种反Web Spam页面的方法
最近,spam页面急剧增加,这极大的影响了搜索引擎的精度和效率.如何抵御spam页面已经成为一个非常重要的问题.文章合并了基于内容来侦测spam页面和基于链接spam侦测spam页面的方法,从而提出了一个两步的侦测spam页面的方法.第一步是一个过滤的步骤,用于生成spam页面的候选列表;第二步,通过一个自动的分类器从候选页面中侦测出最终的spam页面.
垃圾网页、TrustRank、链接spam
23
TP393(计算技术、计算机技术)
2007-06-18(万方平台首次上网日期,不代表论文的发表时间)
共3页
23-25