10.19678/j.issn.1000-3428.0059405
基于双对抗机制的图像攻击算法
图像攻击是指通过对图像添加小幅扰动使深度神经网络产生误分类.针对现有图像攻击算法在变分自编码器(VAE)防御下攻击性能不稳定的问题,在AdvGAN算法的基础上,提出基于对抗机制的AntiVAEGAN算法获取对VAE防御的稳定攻击效果.为应对AntiVAEGAN算法防御能力提升时攻击性能不稳定的问题,结合生成器与鉴别器、生成器与VAE的双对抗机制提出改进的图像攻击算法VAEAdvGAN.在MNIST和GTSRB数据集上的实验结果表明,在无防御的情况下,AntiVAEGAN和VAEAdvGAN算法几乎能达到与AdvGAN算法相同的图像分类准确率和攻击成功率,而在VAE防御的情况下,VAEAdvGAN相比AdvGAN和AntiVAEGAN算法整体攻击效果更优.
生成对抗网络;图像攻击;对抗样本;变分自编码器防御;防御模型
47
TP391(计算技术、计算机技术)
国家自然科学基金;广东省普通高校重点科研项目;广东省教育厅青年创新人才项目
2021-11-18(万方平台首次上网日期,不代表论文的发表时间)
共8页
150-157