多重检验加权融合的短文本相似度计算方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.19678/j.issn.1000-3428.0056847

多重检验加权融合的短文本相似度计算方法

引用
传统相似度计算方法仅考虑文本结构特征或语义信息,从而导致准确率较低.结合短文本特征稀疏的特性,提出一种多重检验加权融合的短文本相似度计算方法MCWFS.使用基于改进编辑距离、考虑词频、基于Word2vec与LSTM的3种方法分别计算相似度,对满足多重检验标准的文本进行加权因子线性融合,以避免因一种相似度值过大或过小导致加权相似度值异常的问题.在此基础上,通过加权融合计算短文本相似度,使得计算结果更加准确合理.实验结果表明,相比层层检验和无检验融合方法,MCWFS方法的平均准确率分别提高16.01%和7.39%,且其F1值可达70.21%.

短文本相似度、多重检验加权融合、编辑距离、语义信息、词频

47

TP391(计算技术、计算机技术)

中国博士后科学基金;陕西省自然科学基金;陕西省重点研发计划;陕西省博士后基金

2021-02-25(万方平台首次上网日期,不代表论文的发表时间)

共8页

95-102

相关文献
评论
暂无封面信息
查看本期封面目录

计算机工程

1000-3428

31-1289/TP

47

2021,47(2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn