10.11896/j.issn.1002-137X.2016.8.045
基于概率生成模型的微博话题传播群体划分方法
事件以话题形式在微博中迅速传播,并能够产生巨大的影响力.因此,对参与话题传播过程的用户进行分析以及发现具有不同主题兴趣情感倾向性的群体受到政府和企业的广泛关注.现阶段,绝大多数应用到微博的群体发现算法都是从单个用户出发,仅考虑了用户社会联系,与用户共享内容相隔离,其群体发现的结果不具有语义信息.少数算法综合了用户社会联系与内容,却忽略了微博本身的结构特性.因此从微博话题的角度出发,综合考虑话题传播过程中的用户交互、微博文本内容以及情感极性,同时结合用户的行为信息,提出了一个基于概率生成模型的微博话题传播群体划分方法BP-STG.采用吉布斯抽样对模型进行推导,不仅能够挖掘出具有不同主题倾向性的群体,同时还能够挖掘出群体的情感倾向分布以及用户在群体中的活跃度及其行为表现.此外,模型还能够推广到许多带有社交网络性质的媒体中.在获取的新浪微博两个话题数据集上的实验表明,BP-STG模型不仅能够有效地对微博话题传播群体进行划分,而且能够发现群体内部活跃用户以及用户在群体中的行为模式.
微博话题、概率生成模型、群体划分、情感元素、行为模式
43
TP391(计算技术、计算机技术)
国家自然科学基金61309007;国家863计划2012AA012902
2016-10-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
223-228,239