10.13413/j.cnki.jdxblxb.2020368
基于改进GFCC特征参数的广播音频语种识别
针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题,提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法.通过提取每帧信号的能量谱包络,去除部分与说话人相关的特征,采用Gammatone滤波器组滤波,经离散余弦变换后再进行倒谱提升,得到改进的伽马频率倒谱系数特征参数.将广播音频信号提取特征参数输入隐Markov模型中进行训练测试,得到的语种识别结果表明,该方法有效提升了广播音频语种识别的准确率,优于目前使用的伽马频率倒谱系数特征及其衍生方法.
广播音频语种识别、能量谱包络、倒谱提升、改进伽马频率倒谱系数
60
TP391;TN912.3(计算技术、计算机技术)
国家自然科学基金61761025
2022-06-17(万方平台首次上网日期,不代表论文的发表时间)
共8页
417-424