10.3969/j.issn.1673-1549.2007.05.003
主题Web信息采集技术
在互联网高速发展的今天,搜索引擎逐渐成为用户在Web上获取信息的主要工具.传统的通用搜索引擎利用一个Crawler程序面向整个Web进行信息采集,它的缺点是采集无针对性、页面失效率高、不能满足特定专业人群的需要.针对这种情况,需要一个分类细致精确、数据全面深入、更新及时的面向主题的搜索引擎.
搜索引擎、Web Crawler、主题搜索引擎
20
TP391(计算技术、计算机技术)
2007-12-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
10-13