DOI：10.11992/tis.201606007

基于词加权LDA算法的无监督情感分类

引用

摘要：

主题情感混合模型可以有效地提取语料的主题信息和情感倾向。本文针对现有主题／情感分析方法主题间区分度较低的问题提出了一种词加权LDA算法（weighted latent dirichlet allocation algorithm，WLDA），该算法可以实现无监督的主题提取和情感分析。通过计算语料中词汇与情感种子词的距离，在吉布斯采样中对不同词汇赋予不同权重，利用每个主题下的关键词判断主题的情感倾向，进而得到每篇文档的情感分布。这种方法增强了具有情感倾向的词汇在采样过程中的影响，从而改善了主题间的区分性。实验表明，与JST（ Joint Sentiment／Topic model）模型相比，WLDA不仅在采样中迭代速度快，也能够更好地实现主题提取和情感分类。

关键词：情感分类、主题情感混合模型、主题模型、LDA、加权算法

所属期刊栏目：11

分类号：TP391(计算技术、计算机技术)

资助基金：山西省回国留学人员科研项目2015-045，2013-033；山西省留学回国人员科技活动择优资助项目2013；山西省自然科学基金项目2014011018-2．

在线出版日期：2016-09-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：539-545

英文信息展示

期刊专题