10.3969/j.issn.1000-3428.2008.20.020
基于模板流程配置的Web信息抽取
针对Web信息抽取中存在的包装器构造复杂及抽取精度等问题,提出并实现了一种基于模板流程配置的Web信息抽取框架.将用户请求、访问和获取Web页面的动作进行分解,抽取其中的动作模式,并映射到流程配置模板中的节点.通过流程解析器对用户创建的流程配置XML描述文档进行解析,抽取感兴趣的信息.试验结果表明,系统可快速、准确地实现抽取.
Web信息抽取、模板流程配置、包装器、框架
34
TP3931(计算技术、计算机技术)
2008-12-01(万方平台首次上网日期,不代表论文的发表时间)
共3页
55-57