10.3969/j.issn.1000-1220.2007.10.014
关于中国Deep Web的规模、分布和结构
随着Web数据库的广泛应用,Web正在加速的"深化",大量的高质量的信息隐藏在Deep Web中.基于IP采样的方法,对1,000,000个IP样本进行了分析统计,揭示了2006年初中国Deep Web的规模、分布和结构.主要结论包括有:①中国Deep Web查询接口往往位于站点浅层,94.6% 的Deep Web查询接口出现在站点的前3层;②中国Deep Web大约有24,000个站点,28,000个Web数据库和74,000个查询接口;③中国Deep Web大部分是非结构化的,其中64%是非结构化的Web数据库;④中国Deep Web分布于多种不同的主题领域;⑤目前主要的中文搜索引擎已覆盖国内Deep Web大约二分之一的页面.
Deep Web、Web数据库、查询接口
28
TP311(计算技术、计算机技术)
教育部科学技术研究重点项目205059;高等学校博士学科点专项科研项目20040285016;江苏省高技术研究发展计划项目BG2005019
2007-11-12(万方平台首次上网日期,不代表论文的发表时间)
共4页
1799-1802