机器阅读理解式中文事件抽取方法

引用

摘要：

事件抽取是信息抽取的重要任务之一,在知识图谱构建、金融行业分析、内容安全分析等领域均有重要应用.现有中文事件抽取方法一般为实体识别、关系抽取、实体分类等任务的级联.将事件抽取转化为阅读理解任务,可为模型引入问题所含的先验信息.提出一种基于预训练模型的机器阅读理解式中文事件抽取方法(Chinese event extraction by machine reading comprehension,CEEMRC),将中文事件抽取简化为两个问答模型的级联.首先对事件触发词抽取、事件类型判定、属性抽取构建相应的问答任务问题.以RoBERTa为基础构建触发词抽取和事件类型识别联合模型、事件属性抽取两个问答模型,并融入触发词先验特征、分词信息、触发词相对位置等信息来提升模型效果.最后以模型预测回答的起始和结束位置完成所需的抽取.实验使用DuEE中文事件数据集,触发词抽取和属性抽取的F1值均优于同类方法,验证了该方法的有效性.

关键词：机器阅读理解、问答任务、预训练模型、中文事件抽取

所属期刊栏目：59

分类号：TP391.1(计算技术、计算机技术)

资助基金：国家自然科学基金;北京市教工委网络舆情信息编报

在线出版日期：2023-09-04（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：93-100

英文信息展示

期刊专题