10.3969/j.issn.1673-629X.2009.02.035
一种高效Web数据抽取包装器的设计与实现
Web包装器是根据特定的抽取规则从特定的Web数据源执行数据抽取程序,设计Web包装器是Web信息抽取和集成的关键技术.详细阐述了一种基于预定义模式的Web包装器的设计与实现过程,并选取了几个出版社的新书发布Web页面进行了数据抽取验证和抽取结果分析,取得了较好的效果.充分体现了此Web包装器的可行性、高效性及可维护性,能够应用在基于Wrapper/Mediator方法的Web数据集成.
包装器、抽取规则、信息抽取、Web数据集成
19
TP311(计算技术、计算机技术)
河南省自然科学基金资助项目0411010500;校博士基金项目2004-010
2009-04-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
123-126