10.16088/j.issn.1001-6600.2019.01.004
基于高层语义注意力机制的中文实体关系抽取
实体关系抽取在挖掘结构化事实的信息抽取系统中扮演着重要的角色.近年来,深度学习在关系抽取任务中取得了显著的成果,同时,注意力机制也逐步地融入到神经网络中,进一步提高了关系抽取的性能.但是,目前的注意力机制主要关注一些低层次的特征,比如词汇等.本文提出一种基于高层语义注意力机制的分段卷积神经网络模型(PCNN_HSATT,high-level semantic attention-based piecewise convolutional neural networks),该模型将注意力机制设置在分段最大池化层后,动态地关注了高层次的语义信息.除此之外,由于中文实体关系语料稀疏性较大,本文利用同义词词林对COAE2016语料进行增强以扩大数据规模.最后在COAE2016和ACE2005的中文语料上进行实验,F 1值分别达到了78.41%和73.94%,与效果最好的SVM方法相比分别提高了10.45%和0.67%,这充分证明了PCNN_HSATT模型在中文关系抽取上的有效性.
关系抽取、卷积神经网络、注意力机制、数据增广、依存句法约束
37
TP391(计算技术、计算机技术)
国家自然科学基金61473294,61370130;北京市自然基金4172047;中央高校基本科研业务费专项资金2015JBM033
2019-02-27(万方平台首次上网日期,不代表论文的发表时间)
共10页
32-41