10.3969/j.issn.1008-0570.2008.30.088
信息抽取中基于DOM树的过滤器方法的研究
分析了信息抽取中各种页面预处理的方法,提出一种改进方法一基于DOM树结构的过滤器,并设计了三种过滤器.讨论过滤器的原理,给出了具体的实现算法.最后根据过滤器的一个具体应用,总结出其适应于当前网页的结构和设计的特点,验证了方法的正确性和适用性,大大提高了信息抽取的效率和准确率.
过滤器、DOM、信息抽取
24
TP393(计算技术、计算机技术)
2009-02-10(万方平台首次上网日期,不代表论文的发表时间)
共3页
217-219