基于情感词典和集成学习的情感极性分类方法
当前情感极性分析时使用机器学习方法进行褒贬分析需要完备的语料库,但对特定领域的语料库构建困难,而只使用情感词典的分类方法准确率低.针对以上缺点提出了一种改进的机器学习方法和情感词典结合的集成学习情感极性分类方法.首先,使用Word2Vec特征提取方法将每条评论表示成固定维度向量,使用常见的机器学习分类方法进行分类,找出效果最好的分类方法;然后使用基于情感词典的朴素贝叶斯分类方法进行情感极性分类.最后将基于情感词典和集成学习的方法相结合,使用谭松波公开的数据集酒店评论数据进行实验.理论分析和实验表明,使用Word2Vec作为特征提取方法的支持向量机(SVM)分类方法结合基于情感词典的朴素贝叶斯分类方法的集成学习方法可以将积极类的准确率和宏平均分别提高6.9个百分点和3个百分点,将消极类的召回率和宏平均分别提高8.8个百分点和5.1个百分点,有效提升了情感极性分类效果.
情感极性分类、机器学习、情感词典、Word2Vec、朴素贝叶斯
38
TP181(自动化基础理论)
2018-08-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
95-98,107