10.3969/j.issn.1673-629X.2007.07.014
基于XML的信息抽取和多层向量空间技术研究
在分析了传统索引技术的缺陷的基础上,提出了一种基于XML架构信息抽取的多层向量空间的模型,重点阐述了如何建立一个基于XML的Web信息抽取平台,从构造知识库、网页优化和信息抽取这三方面进行研究,并阐述了基于XML的多层向量空间模型及其形成.通过这种技术不仅使网页内容得到了清晰的剖析和抽取,更能大大提高对Web网页文档检索效率和准确率.目的在于寻求一种更为高效简洁的检索方法.
XML架构、信息抽取、N层向量空间模型
17
TP311(计算技术、计算机技术)
江苏省高技术研究发展计划项目BG2005019;高等学校博士学科点专项科研项目20040285016;教育部科学技术研究重点项目205059
2007-08-13(万方平台首次上网日期,不代表论文的发表时间)
共4页
49-52