10.19678/j.issn.1000-3428.0056734
融合知识图谱与注意力机制的短文本分类模型
针对短文本缺乏上下文信息导致的语义模糊问题,构建一种融合知识图谱和注意力机制的神经网络模型.借助现有知识库获取短文本相关的概念集,以获得短文本相关先验知识,弥补短文本缺乏上下文信息的不足.将字符向量、词向量以及短文本的概念集作为模型的输入,运用编码器-解码器模型对短文本与概念集进行编码,利用注意力机制计算每个概念权重值,减小无关噪声概念对短文本分类的影响,在此基础上通过双向门控循环单元编码短文本输入序列,获取短文本分类特征,从而更准确地进行短文本分类.实验结果表明,该模型在AGNews、Ohsumed和TagMyNews短文本数据集上的准确率分别达到73.95%、40.69%和63.10%,具有较好的分类能力.
短文本分类、知识图谱、自然语言处理、注意力机制、双向门控循环单元
47
TP391(计算技术、计算机技术)
国家自然科学基金;国家科技支撑计划项目
2021-01-20(万方平台首次上网日期,不代表论文的发表时间)
共7页
94-100