10.3969/j.issn.1673-629X.2017.06.036
基于UR-LDA的微博主题挖掘
以微博为代表的社交网络已经成为用户发布和获取实时信息的重要手段,然而这些实时信息中很大一部分都是垃圾或者是冗余的信息.通过有效的手段,精准地发现、组织和利用社交网络海量短文本背后隐藏的有价值的信息,对微博中隐含主题的挖掘,具有较高的舆情监控和商业推广价值.尽管概率生成主题模型LDA(Latent Dirichlet Allocation)在主题挖掘方面已经得到了广泛的应用,但由于微博短文本消息语义稀疏以及文本之间相互关联等特点,传统的LDA模型并不能很好地对它进行建模.为此,基于LDA模型,综合考虑微博的文本关联关系和联系人关联关系,提出了适用于处理微博用户关系数据的UR-LDA模型,并采用吉布斯抽样对模型进行推导.真实数据集上的实验结果表明,UR-LDA模型能有效地对微博进行主题挖掘.
微博、主题挖掘、UR-LDA、吉布斯抽样
27
TP31(计算技术、计算机技术)
国家自然科学基金青年基金60902065
2017-07-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
173-177,182