10.19678/j.issn.1000-3428.0058025
基于高斯滤波器组混合特征的录音回放攻击检测研究
录音回放是目前声纹识别技术应对各种仿冒语音攻击的主要手段.针对传统语音特征无法区分真实语音和回放语音的问题,提出一种基于高斯滤波器组的Fisher比混合倒谱特征提取算法.将高斯滤波器组代替传统三角滤波器组,分别采用线性频率和逆ERB频率替换MEL频率,形成高斯线性频率倒谱系数特征(G-LFCC)和高斯逆ERB频率倒谱系数特征(G-IEFCC)两个新的特征.通过Fisher准则将G-LFCC和G-IEFCC融合,生成新的混合特征参数,该特征提高了真实语音和回放语音在高频段的区分度,同时降低回放语音在低频段因不同录音及回放设备造成的干扰.在ASVSpoof2017评测数据上的实验结果表明,该算法混合特征具有较好的区分效果,与IMFCC、LFCC、CQCC和GSV等算法相比,等错误概率分别降低21.8%、38.8%、58.3%和43.7%.
录音回放、Fisher准则、高斯滤波器组、逆ERB频率、线性频率
47
TP391(计算技术、计算机技术)
江苏省自然科学基金青年基金BK20150987
2021-03-24(万方平台首次上网日期,不代表论文的发表时间)
共8页
291-297,303