基于词加权LDA算法的无监督情感分类
主题情感混合模型可以有效地提取语料的主题信息和情感倾向。本文针对现有主题/情感分析方法主题间区分度较低的问题提出了一种词加权LDA算法(weighted latent dirichlet allocation algorithm,WLDA),该算法可以实现无监督的主题提取和情感分析。通过计算语料中词汇与情感种子词的距离,在吉布斯采样中对不同词汇赋予不同权重,利用每个主题下的关键词判断主题的情感倾向,进而得到每篇文档的情感分布。这种方法增强了具有情感倾向的词汇在采样过程中的影响,从而改善了主题间的区分性。实验表明,与JST( Joint Sentiment/Topic model)模型相比,WLDA不仅在采样中迭代速度快,也能够更好地实现主题提取和情感分类。
情感分类、主题情感混合模型、主题模型、LDA、加权算法
11
TP391(计算技术、计算机技术)
山西省回国留学人员科研项目2015-045,2013-033;山西省留学回国人员科技活动择优资助项目2013;山西省自然科学基金项目2014011018-2.
2016-09-26(万方平台首次上网日期,不代表论文的发表时间)
共7页
539-545