10.3772/j.issn.1000-0135.2013.03.007
基于潜在狄利克雷分配模型的微博主题演化分析
微博主题的演化分析会帮助用户快速准确地理解主题脉络结构、跟踪主题发展情况,并根据主题演化做出相应的预测.本文对概率主题模型LDA (Latent Dirichlet Allocation)进行了扩展,使其适合中文微博短文本的处理,并利用LDA建模结果对微博主题进行演化分析.为了体现不同时间片中主题演化的动态性,本文在使用LDA建模之前首先对每个时间片内最优主题数目进行确定,再通过LDA主题抽取结果,追踪不同时间片内主题的变化趋势,实现主题在内容和强度两个方面的演化分析.通过在真实微博语料库上进行实验,结果表明该方法不但可以较好地分析出同一微博主题随时间的强度演化规律,还可以描述主题内容的演化趋势.
LDA模型、主题演化、JS距离、微博
32
J6 ;I10
教育部人文社会科学重点研究基地重大项目"面向决策的企业信息资源集成研究"2009JJD870002的研究成果之一
2013-04-22(万方平台首次上网日期,不代表论文的发表时间)
共7页
281-287