基于双对抗机制的图像攻击算法

引用

摘要：

图像攻击是指通过对图像添加小幅扰动使深度神经网络产生误分类.针对现有图像攻击算法在变分自编码器(VAE)防御下攻击性能不稳定的问题,在AdvGAN算法的基础上,提出基于对抗机制的AntiVAEGAN算法获取对VAE防御的稳定攻击效果.为应对AntiVAEGAN算法防御能力提升时攻击性能不稳定的问题,结合生成器与鉴别器、生成器与VAE的双对抗机制提出改进的图像攻击算法VAEAdvGAN.在MNIST和GTSRB数据集上的实验结果表明,在无防御的情况下,AntiVAEGAN和VAEAdvGAN算法几乎能达到与AdvGAN算法相同的图像分类准确率和攻击成功率,而在VAE防御的情况下,VAEAdvGAN相比AdvGAN和AntiVAEGAN算法整体攻击效果更优.

关键词：生成对抗网络;图像攻击;对抗样本;变分自编码器防御;防御模型

所属期刊栏目：47

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金;广东省普通高校重点科研项目;广东省教育厅青年创新人才项目

在线出版日期：2021-11-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：150-157

英文信息展示

期刊专题