农业垂直搜索引擎信息抽取的研究
自动文本信息抽取是垂直搜索引擎技术体系的一个研究方向,针对传统的农业垂直搜索引擎信息抽取精度不高的问题,在研究农业网页交易信息数据的特点的基础上,提出一种针对具有时空属性的行业领域信息的表示与抽取模型.该模型利用数据信息、数据时间、数据空间三元集描述定义此类数据,不仅可以表示数据对象的当前状态,而且可以准确地反映数据对象的历史与空间连续状态,据此设计了K-EA算法.实验结果表明,该模型对于具有时间与空间属性特点的数据有很好的召回率与精度.
垂直搜索引擎、农业、信息抽取、时空属性信息、三元集
30
TP393(计算技术、计算机技术)
清华大学基础研究基金项目JCQN2005042
2009-04-29(万方平台首次上网日期,不代表论文的发表时间)
共5页
1115-1118,1134