10.3969/j.issn.1003-0077.2018.05.007
基于循环神经网络的藏语语音识别声学模型
探索将循环神经网络和连接时序分类算法应用于藏语语音识别声学建模,实现端到端的模型训练.同时根据声学模型输入与输出的关系,通过在隐含层输出序列上引入时域卷积操作来对网络隐含层时域展开步数进行约简,从而有效提升模型的训练与解码效率.实验结果显示,与传统基于隐马尔可夫模型的声学建模方法相比,循环神经网络模型在藏语拉萨话音素识别任务上具有更好的识别性能,而引入时域卷积操作的循环神经网络声学模型在保持同等识别性能的情况下,拥有更高的训练和解码效率.
循环神经网络、藏语语音识别、声学建模、时域卷积
32
TP391(计算技术、计算机技术)
国家重点研发计划项目2016YFB0201402
2018-07-02(万方平台首次上网日期,不代表论文的发表时间)
共7页
49-55