一种基于对抗训练的医疗问答匹配方法
相较于英文开放领域的问答匹配,中文专业医疗领域的问答匹配任务更具有挑战性.针对中文语义和医疗数据的复杂、多样,大多数研究人员都专注于设计繁杂的神经网络来探索更深层次的文本语义,工作思路较为单一,同时神经网络模型很容易因为微小扰动而误判,模型的泛化能力较差.为此,提出了一种基于对抗训练的问答匹配模型,利用双向预训练编码器来捕获问答句的语义信息,从而得到对应的向量表征;再通过在词嵌入表示上添加扰动因子生成对抗样本;最后将初始样本和对抗样本共同输入带有线性层的模型中进行分类预测.在cMedQA V2.0数据集上通过对比实验证明了对抗训练可以有效提升问答匹配模型的性能.
医疗问答、对抗训练、自然语言处理
45
TP311.5(计算技术、计算机技术)
国家自然科学基金U1936216
2022-09-09(万方平台首次上网日期,不代表论文的发表时间)
共7页
37-43