10.13778/j.cnki.11-3705/c.2017.09.008
微博炒作账户统计特征与识别模型初探
随着微博的发展,近几年来网络上以微博为手段进行恶意炒作的事件不断增多,干扰了互联网正常秩序,对国家社会稳定与安全造成严重隐患.本文以新浪微博为研究对象,对规避新浪访问限制保障分布式数据持久采集、利用数据挖掘分类思想进行多特征炒作账户识别进行了研究,在进行特征分析时,选择决策树学习算法,通过测试建立分类模型,最终实现了对炒作微博账户的分析预测.
新浪微博炒作账户、新浪API、网络爬虫、AccessToken算法、决策树
C81(统计方法)
国家自然科学基金青年科学基金项目"微博炒作话题识别与传播人群分析"61309007;2015河南省科技厅软科学项目"河南省对外协同创新联盟研究"152400410182
2017-11-16(万方平台首次上网日期,不代表论文的发表时间)
共7页
47-53