10.16652/j.issn.1004-373x.2022.24.007
跨信道环境下语种识别方法的研究
针对现有语种识别方法对跨信道环境下关注较少的问题进行研究,在实际应用场景中语音采集设备与传输信道差异使得语种识别性能急剧下降.为降低跨信道对识别性能的影响,文中提出一种基于注意力机制的BiLSTM语种识别方法,在特征提取阶段对比MFCC、FBANK、LPCC等不同语音特征的识别效果.实验证明FBANK特征在跨信道环境下的识别效果更好,引入注意力机制能够关注跨信道语音片段中与语种相关的信息,忽略非语种信息.所提方法在东方语种识别竞赛两个跨信道数据集(AP19-OLR和AP20-OLR)上进行实验,通过与基线系统X-VECTOR等语种识别方法进行对比,得出所提方法在两个数据集上的等错误率(EER)降低3.48%和5.66%.实验结果表明,基于注意力机制的BiLSTM语种识别方法能够有效提高语种识别任务中的特征提取能力,并改善跨信道环境下的语种识别性能.
语种识别、跨信道、特征提取、注意力机制、识别方法对比、BiLSTM模型
45
TN911.23-34
国家重点研发计划2017YFC0820602
2022-12-28(万方平台首次上网日期,不代表论文的发表时间)
共7页
37-43