基于字段嵌入的数据库自然语言查询接口
将自然语言转化成数据库可以执行的查询语句,是目前智能交互和人机对话系统的核心难题,也是新型供电列车大数据运用支撑平台对接应用平台及建立城轨列车个性化运维系统的难点.现有的基于神经网络的方法没有充分利用数据表的丰富信息,影响了查询的准确率.针对数据表内容作为输入的情况下,如何提升自然语言查询接口的查询准确率的问题,文中创新地提出了基于数据表内容的字段嵌入方法,利用数据表中每个字段存储的内容对字段进行嵌入表示,并据此提出了新的模型嵌入层结构;此外,提出了一种基于数据表内容的数据增强方法,通过用数据表相同字段中的其他记录去代替查询语句中的属性值,来产生新的训练样本.最后,针对提出的字段嵌入表示和数据增强方法,在WikiSQL数据集上进行了对比实验.实验结果显示,相比当前效果最好的模型,单独使用这两种方法时能够提升0.6%~0.8%的查询准确率,共同使用时则能够提升接近1%的查询准确率,证明所提字段嵌入和数据增强方法对查询准确率有一定的提升作用.
数据库查询、自然语言处理、SQL、词嵌入
47
TP391.1(计算技术、计算机技术)
国家重点研发计划;国家自然科学基金;浙江省自然科学基金
2020-09-25(万方平台首次上网日期,不代表论文的发表时间)
共7页
60-66