GM-FastText多通道词向量短文本分类模型
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.15888/j.cnki.csa.008648

GM-FastText多通道词向量短文本分类模型

引用
在针对短文本分类中文本特征稀疏难以提取、用词不规范导致OOV(out of vocabulary)等问题,提出了基于FastText模型多通道嵌入词向量,和GRU(gate recurrent unit)与多层感知机(multi-layer perceptron,MLP)混合网络结构(GRU-MLP hybrid network architecture,GM)的短文本分类模型GM-FastText.该模型使用FastText模型以N-gram方式分别产生不同的嵌入词向量送入GRU层和MLP层获取短文本特征,通过GRU对文本的特征提取和MLP层混合提取不同通道的文本特征,最后映射到各个分类中.多组对比实验结果表明:与TextCNN、TextRNN方法对比,GM-FastText模型Fl指标提升0.021和0.023,准确率提升1.96和2.08个百分点;与FastText,FastText-CNN,FastText-RNN 等对比,GM-FastText 模型F1 指标提升 0.006、0.014 和 0.016,准确率提升 0.42、1.06和1.41个百分点.通过对比发现,在FastText多通道词向量和GM混合结构网络的作用下,多通道词向量在短文本分类中有更好的词向量表达且GM网络结构对多参数特征提取有更好的性能.

短文本分类、快速文本、词向量、多层感知机、多特征

31

TP391;TU241;F515.653

国家自然科学基金61977021

2022-09-20(万方平台首次上网日期,不代表论文的发表时间)

共6页

403-408

相关文献
评论
暂无封面信息
查看本期封面目录

计算机系统应用

1003-3254

11-2854/TP

31

2022,31(9)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn