一种改进的融合关联词典的微博倾向性分析方法
大多数研究者对微博倾向性分析过多关注的是情感词、形容词和否定词,忽略了关联词对其情感倾向的影响。为了提高微博情感倾向性分析的准确率,提出了融合关联词的微博倾向性分析方法,考虑微博文本中形容词、程度副词以及关联词之间的组合关系。本文充分考虑了关联词的结构特点并在已有词典的基础上构建专门用于微博倾向性分析的微博词典、否定词词典和关联词词典,同时考虑到网络新词对微博倾向性的影响,还构建了一个全新的网络新词词典。借助支持向量机(Support vector ma‐chine ,SVM )将微博文本分为负向、正向和中性3类,通过结合情感词典和SVM的方法提高微博文本倾向性分析的准确率。通过对COASE 2014数据实验可以表明,本文方法对微博倾向性分析取得了较好的效果。
中文微博、倾向分析、支持向量机、关联词
31
TP391(计算技术、计算机技术)
国家自然科学基金61373149,61472233资助项目;山东省科技计划2012GGX10118,2014GGX101026资助项目;山东省教育科学规划ZK1437B010资助项目。
2017-01-06(万方平台首次上网日期,不代表论文的发表时间)
共8页
1220-1227