搜索引擎应对垃圾网页的技术研究
介绍了常见的垃圾网页作弊方式.并对垃圾网页的识别方式进行了详细分析,包括基于网页内容的垃圾网页识别技术、基于链接结构来识别垃圾网页的TrustRank算法以及目前比较流行的用于垃圾页面识别的机器学习分类法.其中采用TrustRank算法与机器学习分类法来识别垃圾网页具有一定的通用性且具有与作弊方式无关的特性.最后提出了一些基于用户行为模式来识别垃圾网页的新思路.
搜索引擎、垃圾网页、网页作弊方式、垃圾网页识别
11
TP393(计算技术、计算机技术)
2015-12-18(万方平台首次上网日期,不代表论文的发表时间)
共3页
20-22