10.3969/j.issn.1674-9456.2015.04.020
一种基于逻辑回归算法的水军识别方法
随着诸如twitter和微博等新媒体的发展,由于网络公关与营销等原因,网络水军也出现并呈现出急剧增加的态势。造成大量的网络资源和普通用户的时间遭到侵占,同时也对舆情真实性产生了重要影响。文章建立一种基于逻辑回归算法的水军识别模型,,利用累计分布函数(CDF)对对新浪微博用户行为属性以及账号属性进行分析和选取,将合适的属性包括好友数、粉丝数、文本相似度、URL率等作为输入参数,用以训练基于逻辑回归算法的分类模型,得到相应系数,从而完成对网络水军识别模型的构建。实验结果证明了模型的准确性和有效性。
twitter、新浪微博、CDF、逻辑回归、水军检测
V24;TP3
国家973项目2013CB329604;国家自然科学基金项目No.61472433资助。
2015-05-04(万方平台首次上网日期,不代表论文的发表时间)
共6页
57-62