10.19363/J.cnki.cn10-1380/tn.2022.01.09
语音对抗攻击与防御方法综述
人工智能的不断发展,使得人与机器的交互变得至关重要.语音是人与智能通讯设备之间通信的重要手段,在近几年飞速发展,说话人识别、情感识别、语音识别得到广泛地普及与应用.特别的,随着深度学习的兴起,基于深度学习的语音技术使机器理解语音内容、识别说话人方面达到近似人的水平,无论是效率还是准确度都得到了前所未有的提升.例如手机语音助手、利用语音控制智能家电、银行业务,以及来远程验证用户防止诈骗等.但是正是因为语音的广泛普及,它的安全问题受到了公众的关注,研究表明,用于语音任务的深度神经网络(Deep neural network,DNN)容易受到对抗性攻击.即攻击者可以通过向原始语音中添加难以察觉的扰动,欺骗DNN模型,生成的对抗样本人耳听不出区别,但是会被模型预测错误,这种现象最初出现在视觉领域,目前引起了音频领域的研究兴趣.基于此,本文对近年来语音领域的对抗攻击、防御方法相关的研究和文献进行了详细地总结.首先我们按照应用场景对语音任务进行了划分,介绍了主流任务及其发展背景.其次我们解释了语音对抗攻击的定义,并根据其应用场景对数字攻击与物理攻击分别进行了介绍.然后我们又按照对抗防御,对抗检测的划分总结了语音对抗样本的防御方法.最后我们对于该领域的不足、前景、以及发展方向进行了探讨.
深度神经网络;语音识别;对抗攻击;对抗防御;人工智能安全
7
TP29(自动化技术及设备)
浙江省自然科学基金No.LY21F030016
2022-03-03(万方平台首次上网日期,不代表论文的发表时间)
共19页
126-144