10.3969/j.issn.1000-3428.2007.18.093
基于Web的智能信息采集及处理系统设计与实现
互联网信息日益扩展的同时,如何采集和利用Web信息越来越备受关注.该文设计和实现的基于Web的智能信息采集及处理系统,采用高效的URL去重和基于模版的下载机制,提高了采集Web资源的性能;应用自然语言处理技术,对采集信息做智能分类和摘要,在发布上突出个性化的信息服务.与同类系统相比,智能性、实用性都显示出了明显的优势.
Web采集、URL去重、智能信息处理、个性化发布
33
TP311(计算技术、计算机技术)
教育部科技基金教技司[2000]175;北京市自然科学基金4022008
2007-11-05(万方平台首次上网日期,不代表论文的发表时间)
共3页
265-267