10.3969/j.issn.1000-3428.2015.04.009
基于特征分析的微博炒作账户识别方法
近年来微博中出现一些炒作账户采用违规手段开展网络公关活动,严重扰乱了正常的互联网秩序,然而传统炒作账户识别方法主要依靠人工分析,其效率低下且不适用于对海量账户进行识别。针对上述问题,提出一种改进的微博炒作账户识别方法,从账户状态、历史微博以及账户邻居3个方面对炒作账户的特征进行分析,构建炒作账户特征集,并利用数据挖掘中的朴素贝叶斯、支持向量机及K最近邻分类等算法对正常账户和炒作账户进行自动分类。实验结果表明,该方法能有效识别微博中的炒作账户,准确率高达95%。
微博、炒作账户、特征分析、特征选择、数据挖掘、分类算法
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61309007;国家“863”计划基金资助项目2012AA012902;国家科技支撑计划基金资助项目2012BAH47B01。
2015-04-29(万方平台首次上网日期,不代表论文的发表时间)
共8页
48-54,59