10.11772/j.issn.1001-9081.2021050861
融合多语义特征的命名实体识别方法
针对语言普遍存在的字符间非线性关系,为捕获更丰富的语义特征,提出了一种基于图卷积神经网络(GCN)和自注意力机制的命名实体识别(NER)方法.首先,借助深度学习方法有效提取字符特征的能力,采用GCN学习字符间的全局语义特征,并且采用双向长短时记忆网络(BiLSTM)提取字符的上下文依赖特征;其次,融合以上特征并引入自注意力机制计算其内部重要度;最后,使用条件随机场(CRF)从融合特征中解码出最优的编码序列,并以此作为实体识别的结果.实验结果表明,与单一采用BiLSTM和CRF的方法相比,所提方法在微软亚洲研究院(MSRA)数据集和BioNLP/NLPBA 2004数据集上的精确率分别至少提高了2.39%和15.2%.可见该方法在中文和英文数据集上都具备良好的序列标注能力,且泛化能力较强.
命名实体识别、序列标注、自注意力机制、图卷积网络、双向长短时记忆网络
42
TP391.1(计算技术、计算机技术)
广东省自然科学基金资助项目501190013
2022-08-01(万方平台首次上网日期,不代表论文的发表时间)
共8页
2001-2008