基于主动学习的社交网络恶意用户检测方法
社交网络恶意用户检测作为分类任务,需要标注训练样本.但社交网络规模通常较大,标注全部样本的花费巨大.为了能在标注预算有限的情况下找出更值得标注的样本,同时充分利用未标注样本,以此提高对恶意用户的检测表现,提出了一种基于图神经网络GraphSAGE和主动学习的检测方法.该方法分为检测模块和主动学习模块两部分.受Transformer的启发,检测模块改进了GraphSAGE,扁平化其聚合节点各阶次邻居信息的过程,使高阶邻居能直接聚合到中心节点,减少了高阶邻居的信息损失;然后通过集成学习,从不同角度利用提取得到的表征,完成检测任务.主动学习模块根据集成分类的结果衡量未标注样本的价值,在样本标注阶段交替使用检测模块和主动学习模块,指导为样本标注的过程,从而更有助于模型分类的样本标注.实验阶段使用AUROC和AUPR作为评价指标,在真实的大规模社交网络数据集上验证了改进的检测模块的有效性,并分析了改进有效的原因;然后将所提方法与现有的两种同类主动学习方法进行比较,实验结果表明在标注相同数量的训练样本的情况下,所提方法挑选标注的训练样本有更好的分类表现.
恶意用户检测、主动学习、图神经网络、社交网络、不平衡数据
48
TP183(自动化基础理论)
四川省科技计划2019YFSY0032
2021-06-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
332-337