中文专利中本体关系获取研究
介绍从中文专利摘要文本中抽取本体非分类关系的方法.首先对摘要文本的句法格式进行分析,按照“领域句式”、“特征句式”、“组件\工艺句式”和“效果句式”等构建子句抽取规则,再利用B、I、E和O等标注符号对子句中的术语进行人工标注,形成一定规模的训练语料集合,并利用CRFs实现训练语料的学习和新语料的抽取.最后给出应用实例并进行分析,验证方法的有效性.
规则匹配、条件随机场、本体学习、非分类关系抽取
TP391(计算技术、计算机技术)
上海市科技发展基金软科学研究项目"基于专利文献的本体构建与应用方法研究"项目13692107000的研究成果之一
2013-11-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
73-78