基于细粒度差异特征的文本匹配方法
文本匹配是检索系统中的关键技术之一.针对现有文本匹配模型对文本语义差异捕获不准确的问题,文中提出了一种基于细粒度差异特征的文本匹配方法.首先,使用预训练模型作为基础模型对匹配文本进行语义的抽取与初步匹配;然后,引入对抗学习的思想,在模型的编码阶段人为构造虚拟对抗样本进行训练,以提升模型的学习能力与泛化能力;最后,通过引入文本的细粒度差异特征,纠正文本匹配的初步预测结果,有效提升了模型对细粒度差异特征的捕获能力,进而提升了文本匹配模型的性能.在两个数据集上进行了实验验证,其中在LCQMC数据集上的实验结果显示,所提方法在ACC性能指标上达到了88.96%,优于已知的最好模型.
文本匹配;预训练模型;语义相似度;对抗学习;差异特征
48
TP391.1(计算技术、计算机技术)
国家自然科学基金;国家重点研发计划;北京信息科技大学科研基金
2021-08-20(万方平台首次上网日期,不代表论文的发表时间)
共6页
60-65