10.3969/j.issn.1671-1122.2021.05.010
一种改进的深度神经网络后门攻击方法
触发器生成网络是深度神经网络后门攻击方法的关键算法.现有的触发器生成网络有以下两个主要问题:第一,触发器候选数据集使用静态的人工选择,未考虑候选数据集对目的神经元的敏感性,存在冗余数据.第二,触发器生成网络仅考虑如何更好地激活目的神经元,并未考虑触发器的抗检测问题.针对候选数据集冗余的问题,文章使用敏感度分析方法,选择相对目标神经元更敏感的数据集从而降低冗余数据.面对现有的触发器检测方法,改进的触发器生成网络可以在保证攻击准确度的情况下,通过设计聚类结果与随机化混淆作为综合惩罚的方法,使生成的触发器绕过检测.实验结果表明,使用这种方法生成的触发器可以在保持较高攻击精确率的同时,在聚类检测方法上表现出较低的攻击检测率,在STRIP扰动检测方法上表现出较高的攻击拒识率.
深度神经网络后门攻击、触发器生成网络、目的神经元、触发器
TP309(计算技术、计算机技术)
国家重点研发计划;国家自然科学基金;中国博士后科学基金;中央高校基本科研业务费专项;四川省重点研发计划
2021-06-02(万方平台首次上网日期,不代表论文的发表时间)
共8页
82-89