10.19678/j.issn.1000-3428.0054925
异构文本数据转换中XML解析方法对比研究
对异构文本数据转换过程中解析XML文本的DOM、SAX、JDOM、DOM4J方法进行对比研究,以解析时间、内存堆占用空间、CPU占用率为评价指标来判定4种解析方法的优劣.该评价方法的优势在于当数据量或数据属性发生变化时,4种解析方法对评价结果的影响仍具有良好的区分度.通过对10份Web日志异构文本数据转换后的XML数据集进行比较,实验结果表明,当数据量增大且以解析时间为重点时,DOM4J解析方法优于其他3种解析方法,当以空间占用为重点时,SAX解析方法优于其他3种解析方法.
异构文本、XML解析、数据结构转换、时间复杂度、空间复杂度
46
TP391.1(计算技术、计算机技术)
吉林省教育厅“十三五”科学技术研究规划项目“基于高校学生综合素质测评数据预测职业发展方向研究”;吉林省教育厅新工科研究;实践项目“U-G-E'卓越软件工程师'人才培养模式与实践教学深化改革”
2020-07-23(万方平台首次上网日期,不代表论文的发表时间)
共9页
286-293,299