10.3969/j.issn.1003-3254.2014.08.030
利用概率主题模型的微博热点话题发现方法
微博具有长度短、实时传播、结构复杂以及变形词多等特点,传统的向量空间模型(VSM)文本表示方法和隐含语义分析(LSA)无法很好的对其进行建模。提出了一种基于概率潜在语义分析(pLSA)和 K 均值聚类(Kmeans)的二阶段聚类算法,此外通过定义微博热度分析和排序,有效地支持微博热点话题发现。实验表明,此方法能有效地进行话题聚类并检测出热点话题。
概率潜在语义分析、话题发现、微博、Kmeans
TP3;TP1
2014-08-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
163-167