10.3969/j.issn.2095-6835.2010.09.003
基于内容与链接特征的中文垃圾网页分类
随着搜索引擎使用的日益普及,web作弊已成为搜索引擎面临的一个重大挑战.国内外研究人员从基于内容,基于链接等方面提出了许多反web作弊的技术,这些技术一定程度上能有效地检测垃圾网页.本文在前人研究基础上提出了一种结合网页内容和链接方面的特征,采用机器学习时中文垃圾网页进行分类检测的方法.实验结果表明,该方法能有效地对中文垃圾网页分类.
网页作弊、搜索引擎、机器学习
26
TP393.098(计算技术、计算机技术)
2014-07-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
6-8