10.3969/j.issn.1000-3428.2012.09.088
微博突发话题检测方法研究
话题检测与跟踪模型不能很好地处理随意性强、用语不规范的微博短信息.为此,提出一种基于动态滑动窗口的微博突发话题检测方法.利用窗口提取具有潜在突发性的信息,采用结合语义的归一化词频·反文档频率函数计算特征权重,构建结合语义的空间向量模型,使用Single-Pass聚类算法思想对其加以改进,生成最终聚类.实验结果表明,该算法能获得较准确的突发话题检测结果.
微博、突发话题、滑动窗口、语义相似度、空间向量模型、话题检测与跟踪
38
TP311(计算技术、计算机技术)
2012-07-13(万方平台首次上网日期,不代表论文的发表时间)
共3页
288-290