10.3969/j.issn.1673-629X.2019.09.005
基于短语级注意力机制的关系抽取方法
关系抽取是自然语言处理的重要研究内容,是知识图谱构建的关键技术.目前,在神经网络中引入注意力机制进行关系抽取成为主流方法,现有方法一般结合句子单词和实体相关性计算注意力,没有考虑短语和实体关系之间的相关性,并且对实体信息利用不够充分.针对该问题,提出基于短语级注意力机制的关系抽取方法.首先用卷积层对词向量做卷积,以滑动窗口的方式得到短语级的向量表示,然后利用短语与实体关系之间的相关性计算注意力.为了使实体信息利用更充分,用卷积层和池化层分别提取实体短语的深度特征表示,并引入TransE的思想表示两个实体关系的特征.最后,采用分段池化方法得到深度特征.为了减少远程监督中错误标签的干扰,使用标签平滑正则化(LSR)把原来的"硬"标签改为"软"标签.实验结果表明,该方法能够有效利用短语信息和实体关系信息,对实体关系抽取效果有较大的提升.
关系抽取、远程监督、分段卷积神经网络、注意力机制、TransE方法、标签平滑正则化
29
TP391(计算技术、计算机技术)
核高基项目基金2015ZX01040-201
2019-10-14(万方平台首次上网日期,不代表论文的发表时间)
共7页
24-30