DOI：10.3969/j.issn.1672-402X.2022.03.001

基于深度残差网络的变换语音伪装检测

引用

摘要：

语音变换(Voice Transformation,VT)是一种隐藏说话人的真实身份的常用操作,它能显著增加自动说话人识别(Automatic Speaker Verification,ASV)系统的错误拒绝率,从而达到防识别的目的.语音变换操作己集成在众多主流的音频/语音处理工具中,并在众多案例中作为犯罪手段,为社会安全带来严重威胁.因此,研究语音变换伪装的检测具有重要意义.但是,目前相关的研究相对不足.为此,本文提出一种基于深度残差网络的变换语音伪装检测方法.所提网络能自动提取语音数据的深层特征,且随着网络层数的增加不会出现梯度退化的现象.另外,本文针对变换操作为语音信号频谱引入的变化特征分布,设计特殊的卷积核和池化,更有利于网络提取特征信息.实验结果表明,本文所提的网络结构可以取得96％以上的精确度,优于目前已报道的研究结果.

关键词：变换语音、防识别伪装、深度残差网络、安全、Deep Residual Net

所属期刊栏目：43

分类号：TP309(计算技术、计算机技术)

资助基金：国家自然科学基金;国家自然科学基金

在线出版日期：2022-08-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：1-7

英文信息展示

期刊专题