10.3778/j.issn.1002-8331.2008-0354
生成对抗网络在数据异常检测中的研究
针对许多检测模型受到数据不平衡和异常数据的复杂性等因素影响问题,提出一种以生成对抗网络(gener-ative adversarial network,GAN)为基础的数据异常检测方法.该方法利用InfoGAN网络训练生成正常数据和异常数据,构造一个推理神经网络作为生成数据与原始数据的标签生成器,之后利用第二个GAN网络对推理网络精调,保证生成的样本和其标签对应;最后将生成样本与标签输入随机森林分类,通过Hyperband算法寻找随机森林最优超参,对推理网络进一步优化.在四个真实数据集上与五种传统机器学习模型进行实验对比,实验结果表明,该模型无需收集更多异常样本,达到数据平衡就可以有效进行数据异常检测.在Mnist数据集中,该模型的AUC值相比于K近邻(K-nearest neighbor,KNN)方法提高0.14,并且综合性能优于传统机器学习模型.
数据异常检测;InfoGAN;随机森林;Hyperband
58
TP39(计算技术、计算机技术)
国家重点研发计划;广东省科技重大专项;福建省自然科学基金;福建省自然科学基金;福建省自然科学基金
2022-03-03(万方平台首次上网日期,不代表论文的发表时间)
共7页
143-149