10.19678/j.issn.1000-3428.0061470
基于噪声溶解的对抗样本防御方法
深度神经网络在发展过程中暴露出的对抗攻击等安全问题逐渐引起了人们的关注和重视.然而,自对抗样本的概念提出后,针对深度神经网络的对抗攻击算法大量涌现,而深度神经网络自身的复杂性和不可解释性增大了防御攻击的难度.为了保证防御方法的普适性,以预处理方法为基本思路,同时结合对抗样本自身的特异性,提出一种新的对抗样本防御方法.考虑对抗攻击的隐蔽性和脆弱性,利用深度学习模型的鲁棒性,通过噪声溶解过程降低对抗扰动的攻击性和滤波容忍度.在滤波过程中,以对抗噪声贡献为依据自适应调整滤波范围及强度,有针对性地滤除对抗噪声,该方法不需要对现有深度学习模型进行修改和调整,且易于部署.实验结果表明,在ImageNet数据集下,该方法对经典对抗攻击方法L-BFGS、FGSM、Deepfool、JSMA及C&W的防御成功率均保持在80%以上,与JPEG图像压缩、APE-GAN以及图像分块去噪经典预处理防御方法相比,防御成功率分别提高9.25、14.86及14.32个百分点以上,具有较好的防御效果,且普适性强.
深度神经网络、对抗样本、乘性噪声、类激活映射、自适应滤波
48
TP391.41(计算技术、计算机技术)
国家重点研发计划;北京航空航天大学软件开发环境国家重点实验室基金
2022-06-23(万方平台首次上网日期,不代表论文的发表时间)
共7页
158-164