10.3969/j.issn.1000-2375.2023.00.042
基于深度学习的混合型文本情感分析方法
近年来,通过技术手段对海量的评论数据和舆情数据进行深度挖掘与分析已经成为各大企业的研究热点.但是随着互联网的快速发展,数据以多种形式出现在网络中,例如,短文本、长文本、Emoji表情符号以及带有Emoji表情符号的混合型句子等.基于数据形式的多样性,本文中提出一种通用型情感分析方法对多种形式的文本数据进行情感分类,即ALBERT+Embedding(emoji+pos)+improvDPCNN模型.实验证明,该模型在目前出现的大多数数据形式中都可以获得不错的分类效果.本模型是将预训练语言模型ALBERT与单独的Embedding层并行执行,然后再与改进的DPCNN串行.Emoji表情符号通过Embedding层随机初始化特征向量,然后与预训练语言模型ALBERT的输出向量进行拼接,作为改进的DPCNN的输入,构成本文中提出的模型ALBERT+Embedding(emoji+pos)+improvDPCNN.通过普通文本、长文本与带有Emoji表情符号的混合型数据集实例将改进的模型与RNN、TextCNN、RCNN、DPCNN、ALBERT+RNN、ALBERT+TextCNN、ALBERT+RCNN、ALBERT+DPCNN这8类模型在准确率、精准率、召回率和F1值等指标上进行对比实验,实验结果表明本文中提出的模型在各种数据形式上都取得了最优的实验效果.
情感分析、ALBERT、Embedding、DPCNN
45
TP391.1(计算技术、计算机技术)
国家自然科学基金62102136
2023-11-16(万方平台首次上网日期,不代表论文的发表时间)
共11页
888-898