面向产品评论分析的短文本情感主题模型
情感主题联合生成模型已经成功应用于网络评论分析。然而,随着智能终端设备的广泛应用,由于屏幕及输入限制,用户书写的评论越来越短,我们不得不面对短评论中的文本稀疏问题。本文提出了一个针对短文本的联合情感–主题模型SSTM (Short-text sentiment-topic model)来解决稀疏性问题。不同于一般主题模型中通常采用的基于文档产生过程的建模方法,我们直接对整个语料集合的产生过程建模。在产生文档集的过程中,我们每次采样一个词对,同一个词对中的词有相同的情感极性和主题。我们将SSTM 模型应用于两个真实网络评论数据集。在三个实验任务中,通过定性分析验证了主题发现的有效性,并与经典方法进行定量对比, SSTM模型的文档级情感分类性能也有较大提升。
情感分类、情感主题模型、主题模型、短文本主题模型、文本稀疏
42
TH1;TN9
国家自然科学基金61373108,61173062,61133012;国家社会科学重大招标计划项目11&ZD189
2016-08-29(万方平台首次上网日期,不代表论文的发表时间)
共11页
1227-1237