10.3969/j.issn.1007-3116.2019.10.003
众包竞赛的离群点欺诈用户检测算法研究
针对基于众包竞赛中欺诈者筛除机制的黄金标准数据方法、聚类算法的离群点检测算法K-means-算法和DBSCAN算法,依赖于事先给定的参数,不适合大规模数据集检测的问题,提出基于样本连通图的离群点检测算法.首先,给定参数并重复调用离群点检测算法,识别数据中的离群点和聚类;其次,计算每两个样本之间的连接次数和连接强度,在给定连接强度下界δ的情况下,根据样本的连接强度来构造样本之间的连通图;最后,根据样本之间的连通情况,对样本进行标记,把样本标记为聚类节点和离群点.实验结果表明,该算法在放宽参数设置范围的情况下,缩小了离群点个数波动范围,提升了离群点识别准确率,优于对比算法和经典的黄金标准数据方法.
众包竞赛、用户欺诈、离群点检测、聚类算法、样本连通图
34
F091.354;C812(经济思想史)
国家重点研发项目《智能服务交易与监管技术研究》2017YFB1400700;国家自然科学基金项目《面向高维大数据的正则化统计方法的相关研究》71701223
2019-10-30(万方平台首次上网日期,不代表论文的发表时间)
共7页
20-26