10.3778/j.issn.1002-8331.1912-0051
基于BTM图卷积网络的短文本分类方法
由于短文本长度较短,在分类时会面临数据稀疏和语义模糊等问题.提出新型图卷积网络BTM_GCN,该网络利用双项主题模型(Biterm Topic Model,BTM)在短文本数据集上训练出固定数量的文档级潜在主题,并作为一种节点嵌入到文本异构图中,再与异构图中的文档节点进行连接,最后利用图卷积网络来捕获文档、词与主题节点之间的高阶邻域信息,从而丰富文档节点的语义信息,缓解短文本语义模糊的问题.在三个英文短文本数据集上的实验结果表明,该方法相比基准模型具有较优的分类效果.
短文本分类、图卷积网络、BTM主题模型
57
TP391.1(计算技术、计算机技术)
2021-03-02(万方平台首次上网日期,不代表论文的发表时间)
共6页
155-160