10.3969/j.issn.1673-629X.2006.05.020
基于XML和N层VSM的Web信息检索
基于XML文档格式良好、层次清晰,可以方便地操纵、分析其结构的特点.文中在将Web上的HTML文档转化为XML文档的基础上,通过Java中的DOM树,分析文档的层次结构.把文档分为层次化的文本段,对传统的VSM算法进行改进,把每个文本段转换为空间向量,实现了N层VSM算法,通过试验证明,改进后算法的查全率和查准率都要优于传统的VSM算法.
XML、XHTML、N层向量空间模型、查全率、查准率
16
TP301.6(计算技术、计算机技术)
2006-07-07(万方平台首次上网日期,不代表论文的发表时间)
共3页
56-58