10.3969/j.issn.1002-1965.2021.01.027
改进的图神经网络文本分类模型应用研究 ——以NSTL科技期刊文献分类为例
[目的/意义]随着互联网数字资源的剧增,如何从海量数据中挖掘出有价值的信息成为数据挖掘领域研究的热点问题.文本大数据分类是这一领域的关键问题之一.随着深度学习的发展,使得基于深度学习的文本大数据分类成为可能.[方法/过程]针对近年来出现的图神经网络文本分类效率低的问题,提出改进的方法.利用文本、句子及关键词构建拓扑关系图和拓扑关系矩阵,利用马尔科夫链采样算法对每一层的节点进行采样,再利用多级降维方法实现特征降维,最后采用归纳式推理的方式实现文本分类.[结果/结论]为了测试该文所提方法的性能,利用常用的公用语料库和自行构建的NSTL科技期刊文献语料库对本文提出的方法进行实验,与当前常用的文本分类模型进行准确率和推理时间的比较.实验结果表明,所提出的方法可在保证文本及文献大数据分类准确率的前提下,有效提高分类的效率.
图神经网络、马尔可夫链采样算法、多级特征降维、NSTL文献分类、文本分类
40
TP393(计算技术、计算机技术)
中国科学技术信息研究所创新面上项目"基于多级降维 CNN 深度学习策略的 NSTL 期刊论文大数据分类应用研究"编号:MS2020-07
2021-02-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
184-188