一种突发性热点话题在线发现与跟踪方法
针对在线发现与跟踪动态突发性文本流中的热点话题问题,在突发性热点词发现与度量方法的基础上提出了一种动态文本模型—动态突发性向量空间模型,用于有效描述文本的动态属性,并且结合文本聚类方法,提出了突发性热点话题的在线发现与跟踪方法.该方法可有效解决传统的基于静态向量空间模型的热点话题发现与跟踪方法仅可分析静态文本的缺陷,并具有以下特点:在特征选择阶段动态地生成热点词特征库,利用模型统一文本和话题的表示,在文本表示时给予突发性热点词更大的权重.基于实际网络文本流数据的实验表明,该方法对突发性热点话题发现的精确率与召回率分别达到92.75%和80.34%,显著优于传统的基于静态向量空间模型方法的实验结果,并可有效跟踪突发性热点话题,弥补了传统静态方法不能有效跟踪热点话题的不足.
突发性热点话题、话题发现与跟踪、向量空间模型
45
TP393.4(计算技术、计算机技术)
国家自然科学基金资助项目60921003,60802056,60905018;国家"863计划"资助项目2007AA01Z480;国家科技支撑计划资助项目2011BAK08B02
2012-03-16(万方平台首次上网日期,不代表论文的发表时间)
共7页
64-69,116