10.3969/j.issn.1673-1549.2013.03.015
XML的DOM树结构在WEB挖掘中的应用
面对飞速发展的信息时代,WEB数据的挖掘日益重要,而传统的搜索引擎难以胜任对数据的挖掘处理.基于XML良好的结构性和层次性,提出了利用DOM树进行WEB挖掘的方法.首先利用Tidy工具库将WEB数据转换成良好结构的XML文件,简化生成DOM树,然后通过遍历解析XML的DOM树结构,提取需要的WEB信息,实现对WEB数据挖掘.实验表明,该方法能够方便地对数据进行结构化存储和信息处理.
WEB挖掘、XML、Tidy、DOM树
26
TP391.1(计算技术、计算机技术)
四川理工学院研究生创新基金项目y2012007
2013-08-01(万方平台首次上网日期,不代表论文的发表时间)
共4页
64-67