10.3969/j.issn.1000-3428.2015.07.006
基于转发层次分析的新浪微博热度预测研究
微博作为新型的消息传播媒介,其影响力和传播速度都超越了传统主流媒体,预测微博热度对舆情监测、政府宣传、企业营销及热点推送等具有重要意义.通过分析微博转发的层次规律,结合转发量、转发深度及广度指标,定义新的热度指数计算方法.将微博热度划分为5个等级,对转发数大于100的微博预测其热度达到特定等级的概率.使用有监督的机器学习算法,先后提取训练样本的静态和动态特征训练热度预测模型.通过自主开发的BigData爬虫开放平台获取来源于新浪微博的训练样本,并应用十折交叉验证法进行实验,结果表明,相比只使用静态特征的热度预测模型,加入微博动态特征能有效提高预测性能,平均F1值达到76.9%.
微博、爬虫、静态特征、动态特征、热度指数、多分类问题
41
TP311.5(计算技术、计算机技术)
国家“863”计划基金资助项目“基于媒体大数据的大众信息消费服务平台及应用示范”SS2014AA012305
2015-09-07(万方平台首次上网日期,不代表论文的发表时间)
共5页
31-35