主题Deep Web爬虫框架研究
为满足用户精确化和个性化获取信息的需要,通过分析Deep Web信息的特点,提出了一个可搜索不同主题Deep Web 信息的爬虫框架.针对爬虫框架中Deep Web数据库发现和Deep Web爬虫爬行策略两个难题,分别提出了使用通用搜索引擎以加快发现不同主题的Deep Web数据库和采用常用字最大限度下载Deep Web信息的技术.实验结果表明了该框架采用的技术是可行的.
深网、爬虫、搜索引擎、信息抽取、常用字
31
TP311(计算技术、计算机技术)
陕西省自然科学基金项目2007F43
2010-05-05(万方平台首次上网日期,不代表论文的发表时间)
共4页
929-931,935