基于不平衡数据与集成学习的属性级情感分类
情感分类一直是自然语言处理领域的重要研究部分.该任务一般是将带有情感色彩的样本分类成正类和负类两种类别.在很多理论模型中,都假设正负类数据样本是平衡的,而在现实中正负类样本一般是不平衡的.提出一种基于属性级的LSTM集成学习的方法,针对不平衡样本数据进行属性级情感分类.首先,对数据集进行欠采样处理,将其分成多组;其次,为每组数据分配一种分类算法进行训练;最后,将多组模型融合,得到最终分类结果.一系列的实验结果显示,基于属性级的LSTM集成学习的方法明显提高了分类的准确性,其性能优于传统的LSTM模型分类方法.
不平衡数据、LSTM、集成学习、情感分类、属性词
49
TP391(计算技术、计算机技术)
2022-06-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
144-149