DOI：10.11684/j.issn.1000-310X.2024.01.016

合成语声的声学分析及识别特征算法

引用

摘要：

当前社会新型犯罪中电信诈骗案件频发,急需一种能够自动有效区分语声真伪的方法.为进一步增强目前深度学习领域识别合成语声的能力,为保障语声信息安全提供技术上的支持,针对合成语声声学特性上异于真实语声的特点,分析对比合成语声和真实语声的声学特性,设计了一种声学特征均方根角量化语声声强变化程度,结合基频变化率和语声窄带频谱图声学特征进行融合,量化了声学特性差异,聚焦了合成语声中关键声学信息.在神经网络模型中融合输入声学特征,在FoR数据集的验证集上得到了 0.6％的等错误率,在测试集上最好结果达到了 10.8％的等错误率.该文成功实现了对合成语声的识别,证实了声学特征的有效性和研究方案的可行性,在一定程度上拓宽了合成语声特征设计的研究思路.

关键词：声学特征、声强、基频、语声频谱图、神经网络

所属期刊栏目：43

分类号：TP391(计算技术、计算机技术)

资助基金：中国人民公安大学拔尖创新人才培养项目2021yjsky017

在线出版日期：2024-02-03（万方平台首次上网日期，不代表论文的发表时间）

页数：共11页

页码：131-141

英文信息展示

期刊专题