基于Web信息组织模型的元数据检索技术
针对目前互联网搜索引擎主要使用全文检索技术,无法从Web页面中提取元数据信息情况,设计了一个基于信息组织模型的Web元数据信息提取和检索系统.使用基于正则表达式的元数据信息提取模型,信息提取和索引程序不断从数量巨大的Web页面中提取元数据信息,对本地元数据库进行不断地更新.抽象了多种Web信息组织模型,设计了相应的信息检索模型,并且这些模型可以大范围地应用于提取Web站点的元数据,所采用的方法充分利用了Web页面的数据结构,避免了采用复杂的语法、语义分析,为面向多个领域的元数据信息检索做出了一定的研究和探索.
元数据、搜索引擎、检索模型、组织模型
26
TP311.13(计算技术、计算机技术)
科技部资助项目2003DKA5G015
2006-08-24(万方平台首次上网日期,不代表论文的发表时间)
共3页
89-90,97