结合扩充词典与自监督学习的网络评论情感分类
在高速发展的互联网时代,网络评论情感分析对分析舆情、监控电商有着重要作用.现有分类方法主要有情感词典方法和机器学习方法.情感词典方法过于依赖词典中的情感词,情感词典越完备,网络评论情感倾向越显著,分类效果越好,但对于情感倾向不易区分的评论,其分类效果欠佳.机器学习方法是一种有监督的方法,其分类效果依赖于大量事先标注的语料,目前语料标注是通过人工完成,工作量极大.文中综合了情感词典和机器学习两种方法的特点,构建了一个网络评论情感分类模型,利用相关领域网络评论对情感词典进行扩充,基于情感词典方法的分类结果,通过自监督学习训练一个分类器,进而提高情感倾向模糊文本的分类正确率.实验表明,与情感词典方法和机器学习方法相比,所提模型在酒店评论、京东评论两个数据集上都获得了更好的情感分类效果.
网络评论、情感分类、词向量、情感词典、机器学习
47
TP391.1(计算技术、计算机技术)
国家自然科学基金61806073,31700858,61802110
2020-12-03(万方平台首次上网日期,不代表论文的发表时间)
共6页
78-82,91