基于双向注意力机制的多文档神经阅读理解

引用

摘要：

机器阅读理解是一项针对给定文本和特定问题自动生成或抽取相应答案的问答任务,该任务是评估计算机系统对自然语言理解程度的重要任务之一.相比于传统的阅读理解任务,多文档阅读理解需要计算模型具备更高的推理和理解能力.为此,提出一种基于多任务联合训练的阅读理解模型,该模型是由一组功能各异的神经网络构成的联合学习模型,其仿效人们推理和回答问题的基本方式分别执行文档选择和答案抽取两个关键步骤.文档选择过程融入了基于注意力矩阵的关联性判别机制,旨在建立各文档间的联系,而答案抽取过程则使用了语篇级的双向注意力机制,来找寻与答案相关的文字线索,将两者附着于一套神经阅读理解模型上,可形成一种基于联合学习的多文档阅读理解方法.在HotpotQA数据集上的实验结果表明,与基线模型相比,该模型的EM值和F1值分别提升了2.1％和1.7％.

关键词：机器阅读理解、多文档、推理、联合训练、注意力机制

所属期刊栏目：46

分类号：TP18(自动化基础理论)

资助基金：国家自然科学基金61672368,61672367,2017YFB1002104

在线出版日期：2021-02-04（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：43-51

英文信息展示

期刊专题