基于多情绪源关联模型的中文微博情感分析
社交媒体信息的爆炸式增长,使得依据其对公众舆论情感的分析受到越来越多的关注。与传统文本不同,新浪微博中存在包括情感词、表情、图片和视频等特征在内的多情绪源,本文针对中文社交短文本情感分析中情感词典时效性问题和多情绪源间的关联性问题,提出了一种多情绪源关联模型。该模型考虑微博中的情感词和表情特征及其之间的关联关系,在经典的词典规则投票方法基础上,引入多情绪源以及关联概率,通过概率建模的方式对情感词和表情两类情绪源建立关联模型,实现对微博情感的判别。实验表明,在6171条微博数据集中,多情绪源关联模型分类准确率达到了85.3%,强于包含情感词和表情的传统投票模型(83.4%)以及包含同类多特征的SVM方法(82.9%)。
多模态情感分析、多情绪源、社交媒体、关联性
11
TP391(计算技术、计算机技术)
国家自然科学基金项目61202143,61305061,61402386,61572409;福建省自然科学基金项目2013J05100.
2016-09-26(万方平台首次上网日期,不代表论文的发表时间)
共8页
546-553