10.3969/j.issn.1000-7024.2004.08.059
基于Agent和XML的Web页面信息抽取研究与设计
在以前相关研究的基础上,提出了一个建立在Agent和XML基础上的Web页面信息抽取的原型系统.在这个原型系统里,利用Agent的自治能力和合作能力来协助用户对抽取请求进行公式化表述和结合知识库学习抽取规则等.另外,系统还用XML语言描述抽取请求和抽取规则,在其中加入一些语义信息,这些语义信息可被有效利用,从而提高抽取的精确性.
Web信息抽取、Agent、XML、抽取规则
25
TP311(计算技术、计算机技术)
2004-09-23(万方平台首次上网日期,不代表论文的发表时间)
共4页
1411-1414