10.3969/j.issn.1673-629X.2003.z2.020
基于HTML和XML的信息提取方法研究
Web作为巨大的数据源,从Web中提取知识是当前信息研究的热点之一.主要研究针对HTML和XML页面如何生成Wrapper程序以便能够自动地从特定网页中提取有用信息,并成为将来进行Web挖掘的基础.
Wrapper程序、句法标记树、过滤算法、超文本标记语言、可扩展标识语言
13
TP311.13(计算技术、计算机技术)
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共2页
54-55