10.3969/j.issn.1671-1122.2020.05.007
基于生成式对抗网络的通用性对抗扰动生成方法
深度神经网络在图像分类应用中具有很高的准确率,然而,当在原始图像中添加微小的对抗扰动后,深度神经网络的分类准确率会显著下降.研究表明,对于一个分类器和数据集存在一种通用性对抗扰动,其可对大部分原始图像产生攻击效果.文章设计了一种通过生成式对抗网络来制作通用性对抗扰动的方法.通过生成式对抗网络的训练,生成器可制作出通用性对抗扰动,将该扰动添加到原始图像中制作对抗样本,从而达到攻击的目的.文章在CIFAR-10数据集上进行了无目标攻击、目标攻击和迁移性攻击实验.实验表明,生成式对抗网络生成的通用性对抗扰动可在较低范数约束下达到89%的攻击成功率,且利用训练后的生成器可在短时间内制作出大量的对抗样本,利于深度神经网络的鲁棒性研究.
深度神经网络、通用性对抗扰动、生成式对抗网络
TP309(计算技术、计算机技术)
国家自然科学基金[61872069;中央高校基本科研业务费[N2017012
2020-06-10(万方平台首次上网日期,不代表论文的发表时间)
共8页
57-64