中文专利中本体关系获取研究

引用

摘要：

介绍从中文专利摘要文本中抽取本体非分类关系的方法.首先对摘要文本的句法格式进行分析,按照“领域句式”、“特征句式”、“组件\工艺句式”和“效果句式”等构建子句抽取规则,再利用B、I、E和O等标注符号对子句中的术语进行人工标注,形成一定规模的训练语料集合,并利用CRFs实现训练语料的学习和新语料的抽取.最后给出应用实例并进行分析,验证方法的有效性.

关键词：规则匹配、条件随机场、本体学习、非分类关系抽取

分类号：TP391(计算技术、计算机技术)

资助基金：上海市科技发展基金软科学研究项目"基于专利文献的本体构建与应用方法研究"项目13692107000的研究成果之一

在线出版日期：2013-11-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：73-78

英文信息展示

期刊专题