10.11772/j.issn.1001-9081.2014.02.0486
基于突发词聚类的微博突发事件检测方法
微博突发事件检测是网络舆情分析的重要分支,近年来已受到国内外学者的广泛关注.分析用户行为特征,提出一种用户影响力计算方法,并将其与微博文本特征、传播特征相结合,提出词语突发度概念作为突发词的判定标准,进而抽取突发词集;引入凝聚式层次聚类算法,对突发词集进行聚类,并筛选出合适的突发词类簇用以描述突发事件,从而实现微博突发事件检测.通过实验检测,结果是正确率为63.64%,召回率为87.5%,F值为0.74,表明该方法可以在大量微博数据中有效检测到突发事件.
突发事件、用户影响力、突发词、聚类
34
TP311.1(计算技术、计算机技术)
国家自然科学基金资助项目61171159,61271304;北京市教委科技发展计划重点项目暨北京市自然科学基金资助B类重点项目KZ201311232037
2014-03-14(万方平台首次上网日期,不代表论文的发表时间)
共6页
486-490,505