融合多粒度信息与外部知识的短文本匹配模型

引用

摘要：

中文短文本通常使用单词序列而非字符序列进行语义匹配,以获得更好的语义匹配性能.然而,中文分词可能是错误或模糊的,容易引入噪声或者错误传播,从而损害模型的匹配性能.此外,多数中文词汇具有一词多义的特点,短文本由于缺少上下文环境,相比一词多义的长文本更难理解,这对于模型正确捕获语义信息是一个更大的挑战.提出一种短文本匹配模型,使用词格长短期记忆网络(Lattice LSTM)融合字符和字符序列的多粒度信息.引入外部知识HowNet解决多义词的问题,使用软注意力机制获取2个句子间的交互信息,并利用均值池化和最大池化算法进一步提取句子的特征信息,获取句子级语义编码表示.在数据集LCQMC和BQ上的实验结果表明,与ESIM、BIMPM和Lattice-CNN模型相比,该模型能有效提升中文短文本语义匹配的准确率.

关键词：短文本语义匹配、词格长短期记忆网络、多粒度信息、外部知识、软注意力机制

所属期刊栏目：48

分类号：TP18(自动化基础理论)

资助基金：甘肃省自然科学基金SKLLDJ032016021

在线出版日期：2022-09-05（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：129-135,143

英文信息展示

期刊专题