DOI：10.3969/j.issn.2095-6835.2010.09.003

基于内容与链接特征的中文垃圾网页分类

引用

摘要：

随着搜索引擎使用的日益普及,web作弊已成为搜索引擎面临的一个重大挑战.国内外研究人员从基于内容,基于链接等方面提出了许多反web作弊的技术,这些技术一定程度上能有效地检测垃圾网页.本文在前人研究基础上提出了一种结合网页内容和链接方面的特征,采用机器学习时中文垃圾网页进行分类检测的方法.实验结果表明,该方法能有效地对中文垃圾网页分类.

关键词：网页作弊、搜索引擎、机器学习

所属期刊栏目：26

分类号：TP393.098(计算技术、计算机技术)

在线出版日期：2014-07-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：6-8

英文信息展示

期刊专题