10.3969/j.issn.1000-1565.2004.02.024
基于文档结构的信息抽取规则的描述语言比较研究
基于文档结构的信息抽取工具很多,XWrap,W4F,Lixto以及自主开发的PQagent是其中比较有代表性的几个.这几个工具采用了不同的规则描述形式,XWrap,W4F,Lixto使用的是自定义的规则描述形式,PQagent采用了通用的规范XQuery来描述规则.现将XWrap,W4F,Lixto使用的规则描述形式与PQagent采用的XQuery进行比较,说明了采用XQuery描述抽取规则的优越性.
信息抽取、抽取规则、描述语言、XQuery
24
TP391;TP393(计算技术、计算机技术)
2004-06-11(万方平台首次上网日期,不代表论文的发表时间)
共7页
212-218