10.3969/j.issn.1000-3428.2004.04.036
智能化网页资源收集工具的设计与实现
随着互联网的普及和发展,网络上的信息资源越来越丰富,它需要高效智能的工具来完成信息资源的采集.介绍了智能化网页收集工具系统的实现方法,它把抓取器与超链分析器、文本自动分类器相结合,完成对用户要求领域的网页的收集.避免对用户不感兴趣领域的抓取.这样可以节省硬件、网络资源和提高资源采集效率.
网页机器人、超链分析、文本自动分类、面向主题抓取
30
TP393(计算技术、计算机技术)
中国科学院国家科学数字图书馆项目CSDL2002-18
2004-03-26(万方平台首次上网日期,不代表论文的发表时间)
共3页
88-89,92