一种网络爬虫系统中URL去重方法的研究
随着互联网技术的发展,网络中包含的信息量承爆炸式增长,如何在数量繁多的信息中找到自己需要的,是一项不小的工程,因此,网络搜索引擎应运而生,随着搜索引擎的发展,越来越多的用户选择使用搜索引擎,但是搜索引擎并不完善,还需要种类繁多的网络爬虫进行辅助。尽管使用了网络爬虫进行辅助,但是为了提高搜索效率,我们需要对采取一些方式来使网络爬虫优先选取那些符合搜索要求的网页,在这种情况下,如何对网络爬虫系统中进行设置来提高URL去重的能力将会对网络爬虫的运行效率产生不小的影响。下文将就如何简单的对URL去重进行阐述。
爬虫系统、URL去重
TP393(计算技术、计算机技术)
本文的研究内容受国家科技支撑计划项目资助项目编号2012BAH04F04
2014-08-12(万方平台首次上网日期,不代表论文的发表时间)
共1页
23-23