10.19678/j.issn.1000-3428.0064560
基于自裁剪异构图的NL2SQL模型
自然语言转换为结构化查询语言(NL2SQL)是语义解析领域的重要任务,其核心为对数据库模式和自然语言问句进行联合学习.现有研究通过将整个数据库模式和自然语言问句联合编码构建异构图,使得异构图中引入大量无用信息,并且忽略了数据库模式中不同信息的重要性.为提高NL2SQL模型的逻辑与执行准确率,提出一种基于自裁剪异构图与相对位置注意力机制的NL2SQL模型(SPRELA).采用序列到序列的框架,使用ELECTRA预训练语言模型作为骨干网络.引入专家知识,对数据库模式和自然语言问句构建初步异构图.基于自然语言问句对初步异构图进行自裁剪,并使用多头相对位置注意力机制编码自裁剪后的数据库模式与自然语言问句.利用树型解码器和预定义的SQL语法,解码生成SQL语句.在Spider数据集上的实验结果表明,SPRELA模型执行准确率达到71.1%,相比于相同参数量级别的RaSaP模型提升了1.1个百分点,能够更好地将数据库模式与自然语言问句对齐,从而理解自然语言查询中的语义信息.
自然语言转换为结构化查询语言、异构图、自裁剪机制、语义解析、预训练语言模型
48
TP391.1(计算技术、计算机技术)
国家自然科学基金;中国博士后基金;中国博士后基金;上海市科技创新行动计划;信息系统工程重点实验室开放基金
2022-09-14(万方平台首次上网日期,不代表论文的发表时间)
共8页
71-77,88