10.19678/j.issn.1000-3428.0060745
融合实体类别信息的实体关系联合抽取
针对实体关系抽取任务中的三元组重叠问题,基于编码器-解码器结构的联合抽取方法能够通过序列生成的方式加以解决.但现有方法没有充分利用实体类别信息,而实体类别信息对于构建更丰富的语义特征并进一步优化关系模型的效果具有重要意义.在使用编码器-解码器结构的基础上,融合实体类别信息构建实体关系联合抽取模型FETI.编码器采用经典Bi-LSTM结构,解码器采用树状解码替代传统的一维线性解码.同时,在解码阶段增加头尾实体类别的预测,并通过辅助损失函数进行约束,使模型能够更有效地利用实体类别信息.在百度公开的中文数据集DuIE上进行实验,结果表明,FETI的F1值达到0.758,相对于CopyMTL、WDec、MHS、Seq2UMTree模型提升了2.02%~9.86%,验证了融合实体类别信息对于提升实体关系抽取模型性能的有效性.此外,基于不同解码顺序和不同权重损失函数的实验结果表明,解码顺序对模型性能影响较大,而对主要任务的损失函数赋予较高权重,能够保证辅助任务为主要任务提供有效的背景知识,同时限制噪声的影响.
实体关系抽取;联合抽取;实体类别信息;三元组重叠;编码器;解码器
48
TP391(计算技术、计算机技术)
国家重点研发计划;国家自然科学基金;上海市自然科学基金;中国科学院上海高等研究院院内人才计划;上海高等研究院与上海光源合作项目
2022-03-22(万方平台首次上网日期,不代表论文的发表时间)
共8页
46-53