DOI：10.13266/j.issn.0252-3116.2020.11.012

依存句法特征的科研命名实体识别算法

引用

摘要：

[目的/意义]探索科研命名实体及其关系的识别与抽取,提升其在长句等复杂情况下的识别效果,为进一步的应用提供参考与借鉴.[方法/过程]以依存句法特征分析为基础,提出一种科研命名实体关系抽取方法,过程包括:①使用Standford Tagger工具对目标文本进行词性标注;②基于标注结果,围绕核心谓词和SAO结构,将目标文本分割为结构规范的语义片段;③通过依存句法分析,找出与核心谓词语义相关的主语和宾语,构成(实体,关系,实体)三元组.[结果/结论]与Ollie、Reverb等主流算法进行的对比测试表明,该方法可以有效提升科研命名实体识别的准确性.

关键词：依存句法分析、科研命名实体、实体识别、关系抽取

所属期刊栏目：64

分类号：G250(图书馆学、图书馆事业)

资助基金：本文系中国科学院文献情报能力建设专项项目"文献情报'数据湖'及开放式大数据框架建设";国家科技图书文献中心专项任务"多源数据增值与知识计算方法研究"

在线出版日期：2020-11-10（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：108-115

英文信息展示

期刊专题