10.3772/j.issn.1000-0135.2015.004.009
一种基于新闻学的微博事件特征选择方法1 &
近年来,微博在突发事件与公共安全中展现了越来越强的影响力。如果缺乏对微博突发事件的检测与监控手段,一旦发生微博突发事件,将使政府部门及企业处于被动地位,甚至危及社会稳定。目前微博事件检测通常采用基于特征集的分类方法,但对于同一个微博数据集,使用不同的特征集往往会得到截然不同的结果。因此,如何根据微博事件检测的要求选择合适的特征集是目前亟待解决的一个关键问题。本论文提出了一种新的微博事件特征选择方法。该方法借鉴了新闻学上的事件“5W”要素,在微博事件的“5W”初始特征集上通过交叉迭代方法优选出最优的特征集。我们在实际的微博数据集上,基于准确率、召回率、F 值等多种指标比较了我们提出的方法与巳有的4种特征选择策略的性能。结果表明,本文提出的方法可以降低最终选择的特征数目,并且在微博事件检测上具有较高的召回率和F 值。
微博、新闻学、事件检测、特征选择
TP3;TP1
1基金项目本文得到了国家自然科学基金面上项目“基于时空语义的微博突发事件检测与短期预测研究”71273010;安黴大学博士科研启动经费项目“微博事件抽取与决策应用研究”资助。
2015-10-30(万方平台首次上网日期,不代表论文的发表时间)
共8页
424-431