多标签文本分类研究进展

引用

摘要：

文本分类作为自然语言处理中一个基本任务,在20世纪50年代就已经对其算法进行了研究,现在单标签文本分类算法已经趋向成熟,但是对于多标签文本分类的研究还有很大的提升空间.介绍了多标签文本分类的基本概念以及基本流程,包括数据集获取、文本预处理、模型训练和预测结果.介绍了多标签文本分类的方法.这些方法主要分为两大类:传统机器学习方法和基于深度学习的方法.传统机器学习方法主要包括问题转换方法和算法自适应方法.基于深度学习的方法是利用各种神经网络模型来处理多标签文本分类问题,根据模型结构,将其分为基于CNN结构、基于RNN结构和基于Transformer结构的多标签文本分类方法.对多标签文本分类常用的数据集进行了梳理总结.对未来的发展趋势进行了分析与展望.

关键词：自然语言处理、多标签文本分类、深度学习

所属期刊栏目：57

分类号：TP391(计算技术、计算机技术)

资助基金：国家部委科技创新特区计划项目

在线出版日期：2021-05-24（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：48-56

英文信息展示

期刊专题