定向查询引擎在Web化学数据库集成检索中的应用
Internet上的化学数据库是重要的专业资源,基于超链接分析的搜索引擎还不能索引这类资源.本论文以充分利用Internet上的化学数据库数据为目标,将”一个查询发动多个同级检索引擎,并以结构化的方式组织信息”的方案应用于以化合物标识信息为检索入口的Web化学数据库,建立了一个基于多站点集成检索的Web数据库定向查询引擎.该引擎是一个包括用户交互层、中间检索层、数据提供层的三层Web模型.各层在系统内部分别对应于响应用户检索请求的客户端代理模块、集成远程Web信息的服务器端代理模块,以及提供缓存和检索的关系数据库模块.模型采用JSP+Java组件的开发方式,在HTTP协议标准发送方法的基础上,采用XML技术对检索返回文档进行结构化数据的提取和表示,利用XML-DBMS实现XML数据的存储和检索,建立了一套针对深层Web数据交换的解决方案.依此方案所建立的ChemDB Portal Search实现了四个分布式Web化学数据库的有效加入、同时检索和统一显示.该系统是针对深层Web信息的挖掘和集成检索的一次尝试,它可为其它领域建立类似的系统提供借鉴.
定向查询引擎、深层网、Web数据挖掘、分布式数据库、集成检索、XML
22
TP392(计算技术、计算机技术)
2005-11-24(万方平台首次上网日期,不代表论文的发表时间)
共8页
659-666