10.3969/j.issn.2095-2163.2017.02.026
面向新浪微博的信息溯源技术研究
随着微博的高速发展,微博信息溯源成为信息内容安全管理的重要研究内容之一.此前的信息溯源研究中,事件数据纯度不高,且用户影响力涉及的因素考虑得不够全面,本文即针对以上问题进行研究.首先,由于微博信息采集过程中,得到的数据纯度较低,对大量的新浪微博数据进行事件聚类,得到某一具体事件的相关微博.接着,为了得到更合理的用户影响力数值,针对具体事件涉及到的用户,考虑多个因素,进行用户影响力分析,得到用户的影响力数值.最后,综合考虑微博的发布时间和用户影响力数值,使用Hacker News排序算法,对具体事件进行信息溯源.最终分析得出了事件传播过程中,发布时间较早,且用户影响力较大的一篇微博为事件源头.
新浪微博、事件聚类、用户影响力分析、信息溯源
7
TP391.41(计算技术、计算机技术)
国家自然科学基金61202457;973项目2011CB302605
2017-06-12(万方平台首次上网日期,不代表论文的发表时间)
共5页
94-98