10.19678/j.issn.1000-3428.0063788
基于双向语义的中文实体关系联合抽取方法
现有中文实体关系抽取方法通常利用实体间的单向关系语义特征进行关系抽取,然而仅靠单向语义特征并不能完全利用实体间的语义关系,从而使得实体关系抽取的有效性受到影响.提出一种基于双向语义的中文实体关系联合抽取方法.利用RoBERTa预训练模型获取具有上下文信息的文本字向量表征,通过首尾指针标注识别句子中可能存在关系的实体.为了同时利用文本中的双向关系语义信息,将实体分别作为关系中的主体与客体来建立正负关系,并利用两组全连接神经网络构建正负关系映射器,从而对每一个输入实体同时从正关系与负关系的角度构建候选关系三元组.将候选关系三元组分别在正负关系下的概率分布序列与实体位置嵌入特征相结合,以对候选三元组进行判别,从而确定最终的关系三元组.在DuIE数据集上进行对比实验,结果表明,该方法的精确率与召回率优于MultiR、CoType等基线模型,其F1值达到0.805,相较基线模型平均提高了12.8%.
实体关系联合抽取、双向关系语义、正负关系映射、全连接神经网络、预训练语言模型
49
TP181(自动化基础理论)
湖南省科技计划项目2016JC2011
2023-01-16(万方平台首次上网日期,不代表论文的发表时间)
共9页
92-99,112