10.3969/j.issn.1000-1220.2018.05.020
一种语义弱监督LDA的商品评论细粒度情感分析算法
随着商品评论文本数据的日益增加,需要利用情感分析技术来自动实现商品的情感极性分类,尤其是细粒度的情感分类.LDA主题模型可以实现大规模文本数据的主题词提取,并利用主题聚类功能发现特征词和情感词之间的潜在关系,但LDA模型倾向于提取粗粒度的情感分类知识,难以满足细粒度情感分析的语义需求.本文提出了一种语义弱监督的主题模型,在LDA模型中嵌入词语关联、全局特征词及主题情感隶属语义先验知识来提升LDA对特征词、情感词及其关系的识别能力.主要研究内容包括:从句法分析、词性关系和语境相关等角度进行词语关联语义约束的提取;全局特征词识别和主题情感隶属两类语义约束的获取;设计语义约束对LDA主题分配的影响机制,构建语义弱监督的细粒度情感分析主题模型SWS-LDA.实验表明,SWS-LDA模型可以改善LDA的语义理解能力,提高局部特征词和局部情感词的提取率,提升主题模型细粒度情感极性分类的准确性.
商品评论、主题模型、LDA、情感分析、弱监督
39
TP311(计算技术、计算机技术)
国家自然科学基金项目61662032,61462040;江西省高校人文社科项目JC1544,TQ1505
2018-07-11(万方平台首次上网日期,不代表论文的发表时间)
共8页
978-985