10.3772/j.issn.1000-0135.2017.10.012
领域学术本体概念等级关系抽取研究
等级关系抽取是领域本体自动构建的必经阶段,目前研究主要集中在生物医学领域,此外还存在现有方法效率不高的问题.本文提出一种面向领域学术资源的概念等级关系抽取的方法.首先,从概念抽取阶段开始,将学术文献中的概念分为方法/任务/工具/资源类术语,采用层叠条件随机场与C-value和规则相结合的方法分别对各个术语类型进行抽取,得到初始的分类术语;其次,在已有的术语类别限定下,结合外部词库和基于Web的方法抽取等级关系概念对;最后,采用基于图的方法将概念对生成图模型,再利用图剪枝方法生成概念等级关系.实验采用领域学术文献语料集对所提出的方法进行验证,在概念抽取阶段抽取不同类型的术语,得到较高的准确率与召回率,并进行了等级关系概念对的抽取,最终生成了概念等级关系,实验证实了本文提出的方法的可行性与有效性.
本体构建、等级关系抽取、术语抽取
36
G25;G23
国家社会科学基金重大招标项目"面向学科领域的网络信息资源深度聚合与服务研究"12&ZD221
2017-12-26(万方平台首次上网日期,不代表论文的发表时间)
共13页
1080-1092