10.3969/j.issn.1000-1220.2003.09.012
一种基于多叉树的HTML到XML的转换方法
当前的Web信息大多数都是HTML格式的,由于HTML文件中没有严格的结构性,故很难能用一种有效的方法来检索或提取隐藏其中的数据.针对HTML的这种缺陷,本文提出了基于多叉树的HTML到XML转换方法,把对HTML的信息检索问题转化为对XML的检索问题,以便简化下一步的检索问题.
HTML、XML、多叉树、信息检索
24
TP312(计算技术、计算机技术)
国家自然科学基金60005004;安徽省自然科学基金01042302
2003-11-07(万方平台首次上网日期,不代表论文的发表时间)
共4页
1617-1620