DOI：10.19734/j.issn.1001-3695.2022.03.0066

融合文本图卷积和集成学习的文本分类方法

引用

摘要：

为了提高文本分类的准确率并解决文本图卷积神经网络对节点特征利用不足的问题,提出了一种新的文本分类模型,其内在融合了文本图卷积和Stacking集成学习方法的优点.该模型首先通过文本图卷积神经网络学习文档和词的全局表达以及文档的语法结构信息,再通过集成学习对文本图卷积提取的特征进行二次学习,以弥补文本图卷积节点特征利用不足的问题,提升单标签文本分类的准确率以及整个模型泛化能力.为了降低集成学习的时间消耗,移除了集成学习中的k折交叉验证机制,融合算法实现了文本图卷积和Stacking集成学习方法的关联.在R8、R52、MR、Ohsumed、20NG等数据集上的分类效果相对于传统的分类模型分别提升了1.5％、2.5％、11％、12％、7％以上,该方法在同领域的分类算法比较中表现优异.

关键词：文本表示、文本分类、文本图卷积、集成学习、融合模型

所属期刊栏目：39

分类号：TP391.1(计算技术、计算机技术)

资助基金：国家自然科学基金61873068

在线出版日期：2022-10-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：2621-2625

英文信息展示

期刊专题