一种增强的多粒度特征融合语义匹配模型
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3969/j.issn.1673-629X.2022.07.005

一种增强的多粒度特征融合语义匹配模型

引用
语义匹配作为自然语言处理任务中重要的一环,直接制约问答系统、信息检索等任务的效率.针对现有语义模型大多只以词为基本语义单元进行注意力交互,较少考虑中文中的词边界模糊和字符信息获取不足而带来的语言颗粒度对整体建模忽略的问题,提出一种增强的多粒度特征融合语义匹配模型EMGFM.首先结合BERT模型和word2vec以获得增强的字符向量表示,然后从字、词、句三种粒度进行注意力的交互,并对交互结果进行加权融合,以突出不同交互信息对整体建模的贡献.为减少交互过程中产生的信息损失,通过构造差异性来对交互信息进行信息增强.最后通过最大池化、平均池化两种方式获得文本的最终语义表示以进行匹配度的计算.该模型在CCKS问句匹配大赛中文数据集上达到了87%的正确率,相比于一些语义匹配的经典模型准确率均有提升,证明该方法确实能有效提升问句语义匹配的准确性.

语义匹配、语言颗粒度、Siamese网络、可分解注意力机制、BERT模型

32

TP301(计算技术、计算机技术)

黑龙江省自然科学基金项目;东北石油大学青年科学基金;东北石油大学优秀中青年科研创新团队

2022-08-01(万方平台首次上网日期,不代表论文的发表时间)

共6页

28-33

相关文献
评论
暂无封面信息
查看本期封面目录

计算机技术与发展

1673-629X

61-1450/TP

32

2022,32(7)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn