基于LSTM的藏语语音识别
针对藏语语音识别处理的步骤,首先将藏语语料的国际音标转换,其次根据人耳对语音的处理方式,使用MFCC进行语音特征提取,再构建CNN_BiLSTM_CTC声学模型,最后利用2-gram语言模型进行音标与文字的转换.该文最终实现语音转文本,并在音标识别上有较好的准确率.
藏语、语音识别、MFCC、CNN_BiLSTM_CTC、2-gram
16
TP183(自动化基础理论)
大学生创新创业训练计划项目;基于LSTM的藏语音素识别系统研究
2020-03-25(万方平台首次上网日期,不代表论文的发表时间)
共2页
154-155