10.11772/j.issn.1001-9081.2020050738
基于句法依存分析的图网络生物医学命名实体识别
现有的生物医学命名实体识别方法没有利用语料中的句法信息,准确率不高.针对这一问题,提出基于句法依存分析的图网络生物医学命名实体识别模型.首先利用卷积神经网络(CNN)生成字符向量并将其与词向量拼接,然后将其送入双向长短期记忆(BiLSTM)网络进行训练;其次以句子为单位对语料进行句法依存分析,并构建邻接矩阵;最后将BiLSTM的输出和通过句法依存分析构建的邻接矩阵送入图卷积网络(GCN)进行训练,并引入图注意力机制优化邻接节点的特征权重得到模型输出.所提模型在JNLPBA和NCBI-disease数据集上的F1值分别达到了76.91%和87.80%,相比基准模型分别提升了2.62和1.66个百分点.实验结果证明,提出的方法能有效提升模型在生物医学命名实体识别任务上的表现.
生物医学、命名实体识别、双向长短期记忆网络、图卷积网络、句法依存分析、图注意力机制
41
TP391.1(计算技术、计算机技术)
国家重大新药创制国家科技重大专项;国家重点研发计划项目
2021-03-09(万方平台首次上网日期,不代表论文的发表时间)
共6页
357-362