10.3969/j.issn.1000-3428.2006.20.016
基于XML的Web数据挖掘关键技术的研究
由于存在着大量的在线信息,WWW成为数据挖掘的热点.该文介绍了Web网页的数据挖掘技术,提出一种基于XML的Web数据挖掘模型,阐述将半结构化HTML文档转换成良构的XML文档的原因,并给出基于HTML Tide库的转换代码,介绍了利用XML技术从Web网页析取数据的关键技术,包括XHTML、XSLT和XQuery等,对Web数据挖掘的其他方面如数据检验和集成作了一定的探讨.
Web数据挖掘、XML模型、关键技术
32
TP311(计算技术、计算机技术)
国家重点实验室基金
2006-11-23(万方平台首次上网日期,不代表论文的发表时间)
共3页
43-44,77