10.3969/j.issn.1000-3428.2011.20.089
基于语义的林产品贸易文本信息结构化研究
根据林产品贸易文本信息推送中信息结构化存储的需要,结合语义识别的基本原理和基于规则的信息抽取方法,提出一种基于规则的林产品贸易文本信息抽取方法,利用林产品贸易文本信息的特征,定义林产品贸易文本信息的文本层次识别规则,采用创建数据库和数据表匹配识别规则,给出识别规则匹配的正则表达式和文本内容截取识别规则,以抽取需要的特定事实信息,并以一种结构化的形式存储于数据库中.通过对实际林产品贸易网站的文本信息结构化抽取,证明该研究在林产品贸易信息推送中具有较好的应用价值.
语义、林产品、贸易文本信息、结构化、信息抽取、识别规则
37
TP391(计算技术、计算机技术)
中央高校基本科研业务费专项基金资助项目“多元异构林产品信息推送平台研究与实践”BLYX200928
2012-01-18(万方平台首次上网日期,不代表论文的发表时间)
共3页
261-263