10.3778/j.issn.1002-8331.2201-0418
融入关系形式化概念的端到端三元组抽取
三元组抽取是知识学习、图谱构建的基础性工作.针对当前任务模型多存在实体识别与关系抽取语义关联不强、实体嵌套、关系重叠,以及既有概念知识关注不多等问题,融合形式化概念与神经网络模型,提出一种基于关系形式化概念的端到端三元组抽取方法.提出关系形式化概念标签,以统一实体与关系的语义表达,把实体识别问题转换为概念标签学习问题;将实体输入到关系形式化概念注意力模型,该注意力机制力图捕获关系主客体概念的连通内涵特征,即训练获得每个关系标签对应的主客体及它们上下文依存谓词的综合特征;通过多个关系分类器输出每对主客体的多关系标签,实现基于概念连通的多关系抽取;另外模型还可引入既有形式化概念的外延、内涵,以改善模型对语料标签的依赖,以及实体嵌套导致的标记难题.实验基于两份数据集,采用三种评价指标对模型性能进行评价分析.实验结果证明提出的模型在知识抽取上具有切实可行的效果,可改善实体嵌入、关系重叠问题.
三元组抽取、形式化概念、注意力、关系重叠
59
TP391(计算技术、计算机技术)
国家重点研发计划;江西省教育厅科学技术研究重点项目;江西省教育厅科学技术研究课题;江西中医药大学博士启动基金项目;江西省研究生创新专项资金项目;江西省一流学科建设科研启动基金专项项目
2023-05-15(万方平台首次上网日期,不代表论文的发表时间)
共8页
182-189