预训练语言模型在科学类QA方向的探索研究——基于ARC数据集

全文直达

下载全文

在线阅读

引用

摘要：

随着自然语言处理(Natural Language Processing,NLP)技术取得的巨大进步,业界出现了各种更加复杂的自然语言处理数据集和具有更高难度的任务.AI2逻辑挑战(AI2 Reasoning Challenge,ARC)数据集是目前最具挑战性的问题回答(Question Answering,QA)数据集之一,该数据集由7787道小学科学试题组成,分为挑战集和简单集.聚焦于解决ARC数据集对NLP带来的挑战,使用RoBERTa、BERT和T5等预训练语言模型,对ARC数据集带来的问题进行探索研究.

关键词：自然语言处理、预训练语言模型、ARC数据集

所属期刊栏目：24

分类号：TP391.1(计算技术、计算机技术)

资助基金：河北省高等学校科学研究计划自然科学重点项目ZD2022068

在线出版日期：2022-09-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：1-5

英文信息展示

期刊专题