10.16208/j.issn1000-7024.2022.08.028
基于BERT的中文新闻标题分类
为解决海量新闻标题分类任务准确率低的问题,提出了一种基于BERT的中文新闻标题分类算法.使用BERT预训练的词向量作为嵌入层,根据输入文本进一步优化词向量,使用单向GRU网络提取主要的文本特征,连接注意力机制,对特征加权求和来调整权重比例,连接单向LSTM网络提取上下文特征,进行分类.实验结果表明,BGAL模型在进行中文新闻标题分类任务时,可以有效兼顾分类精度和运算效率,在处理THUCNews数据集时,达到了94.78%的准确度,比BERT_RNN高出1.07%.
中文短文本分类、自然语言处理、深度学习、神经网络、可变的双向编码器
43
TP391.1(计算技术、计算机技术)
国家自然科学基金;科技创新服务能力建设-科研基地建设-北京实验室-国家经济安全预警工程北京实验室基金项目;北京市自然科学基金
2022-08-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
2311-2316