10.3969/j.issn.2095-2163.2016.01.005
基于评论与转发的微博联合主题挖掘
微博文本简短、信息量少且语法随意,传统主题分类并不理想.Labeled LDA在LDA主题模型上附加类别标签协同计算隐含主题分配量使文本分类效果有所改进,但标签在处理隐式微博或主题频率相近的分类上,存在一定的模糊分配.本文提出的Union Labeled LDA模型通过引入评论转发信息丰富Label标签,进一步提升标签监督下的主题词频强度,一定程度上显化隐式微博、优化同频分配,采用吉布斯采样的方法求解模型.在真实数据集上的实验表明,Union Labeled LDA模型能更有效地对微博进行主题挖掘.
微博、主题挖掘、LDA、Union Labeled LDA、词频
6
TP391.1(计算技术、计算机技术)
2016-06-03(万方平台首次上网日期,不代表论文的发表时间)
共5页
16-20