10.3969/j.issn.1672-9722.2020.02.022
基于时间窗口包含用户行为的微博突发话题检测方法
鉴于微博格式随意不规范、消息噪声大等特点,在已有的动量模型上考虑微博的时间衰减性和用户的网络行为,提出基于时间窗口包含用户行为的微博突发话题检测方法.从动态时间窗口中提取微博消息流,推动时间窗口,实时检测有意义串来发现微博出现的新词作为初步候选突发特征.在传统动量模型基础上加入用户网络行为,动量建模初步候选突发特征,结合其能量大小、随时间变化的趋势以及二阶序列的变化,识别并且过滤伪突发特征.最后,通过K-means聚类将有效的突发特征归类,合并成为突发话题.实验表明,该方法适用于微博突发话题检测,提升了突发话题检测的准确率和召回率.
突发话题、突发特征、微博、动量模型、时间窗口
48
TP311(计算技术、计算机技术)
2020-05-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
383-388