10.3969/j.issn.1671-1513.2009.02.010
基于CSS选择器的深网结果页抽取方法
提出一种基于CSS选择器的深网结果页数据抽取方法,用于抽取深网结果页中的数据记录.实验结果表明在大多数情况下,该方法都能准确抽取出页面中的数据记录.
深网、CSS、MDR、数据抽取
27
TP311.135.4(计算技术、计算机技术)
北京市科技新星计划项目2006B10;北京优秀人才计划项目20071D0500300136
2009-06-24(万方平台首次上网日期,不代表论文的发表时间)
共6页
40-45