10.3778/j.issn.1002-8331.2112-0418
单步片段标注的实体关系联合抽取模型
关系抽取作为知识图谱等诸多领域的上游任务,具有广泛应用价值,近年来受到广泛关注.关系抽取模型普遍存在暴露偏差问题,抽取文本普遍存在实体嵌套和实体重叠问题,这些问题严重影响了模型性能.因此,提出了一种基于片段标注的实体关系联合抽取模型(span-labeling based model,SLM),主要包括:将实体关系抽取问题转化为片段标注问题;使用滑动窗口和三种映射策略将词元(token)序列进行组合排列重新平铺成片段(span)序列;使用LSTM和多头自注意力机制进行片段深层语义特征提取;设计了实体关系标签,使用多层标注方法进行关系标签分类.在英文数据集NYT、WebNLG上进行实验,相对于基线模型F1值显著提高,验证了模型的有效性,能有效解决上述问题.
关系抽取、联合抽取、片段标注、映射策略、暴露偏差、实体嵌套、实体重叠
59
TP391.1(计算技术、计算机技术)
吉林省教育厅十三五科学技术项目JJKH20200677KJ
2023-05-15(万方平台首次上网日期,不代表论文的发表时间)
共10页
130-139