10.3969/j.issn.1672-9722.2022.11.029
一种基于Seq2Seq框架和文本数据处理的问答对生成方法
为解决从未标记文本中自动化的生成问答对(Q&A),提出了一种基于Seq2Seq框架和自动化构建数据的问答对生成方法(Seq2Seq-TDP-QAG).首先,已知段落、问题、答案的阅读理解数据集中,通过构造函数从中获得线索、问题类型信息构造训练数据集,并用数据训练基于Seq2Seq框架的问题生成模型;其次,采用三步取样法从未标记文本中获取答案、线索、问题类型信息,构造问题生成模型的输入数据集,并输入模型中初步生成问题信息;最后,通过数据过滤器来控制问题的质量,生成高质量的问题信息,并和答案组成问答对.将提出的方法在SQuAD数据集上进行实验,与PCFG-Trans模型相比ROUGE-L和METEOR分别提升18.68和6.13,结果证明,Seq2Seq-TDP-QAG有能够生成质量更高的问答对.
问答对生成、Seq2Seq框架、数据处理、问答对质量
50
P413(大气探测(气象观测))
2023-02-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
2515-2520