10.11959/j.issn.1000-0801.2023121
采用圆周局部三值模式纹理特征的合成语音检测方法
为了进一步提高合成语音检测的准确率,提出了一种采用圆周局部三值模式(CLTP)纹理特征的合成语音检测方法.该方法利用圆周局部三值模式提取语谱图中的纹理信息并作为语音的特征表示,采用深度残差网络作为后端分类器来判决语音真伪.实验结果表明,在ASVspoof 2019数据集上,与传统的常量Q倒谱系数(CQCC)和线性预测倒谱系数(LPCC)两种特征相比,该方法在等错误率(EER)上分别降低了54.29%和 2.15%,与局部三值模式(LTP)纹理特征相比,该方法在等错误率上也降低了 17.14%.圆周局部三值模式由于综合考虑了邻域内中心像素与周边像素之间以及各周边像素之间的差异,更加全面地获取了语谱图的纹理信息,提高了合成语音检测的准确率.
说话人验证、合成语音检测、圆周局部三值模式、深度残差网络
39
TP391.42(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;国家自然科学基金
2023-07-12(万方平台首次上网日期,不代表论文的发表时间)
共11页
85-95