10.16652/j.issn.1004⁃373x.2022.11.013
基于深度神经网络的资源匮乏语言语音关键词检索
资源匮乏语言语音信息检索研究比汉语、英语等大语言进展缓慢,需要大量预处理工作.神经网络模型在低资源环境下的高效建模能力给低资源语言信息处理工作带来便利.文中以维?哈等低资源语言为基础,通过一系列预处理过程获得了这些语言的语音及文本资源,再利用高斯混合隐马尔可夫模型GMM?HMM、深度神经网络隐马尔可夫模型DNN?HMM等完成了关键词检索实验.实验结果表明,三音素下的DNN?HMM模型比GMM?HMM模型检索性能要好.维吾尔语的ATWV达到了0.368,MTWV达到了0.491,检索结果准确率达到了89.36%;哈萨克语的ATWV达到了0.382,MTWV达到了0.421,检索结果准确率达到了82.15%.
语音关键词检索、维吾尔语、哈萨克语、深度神经网络、检索流程、声学模型
45
TN711-34;TP391.1(基本电子电路)
国家重点研发计划2017YFC0820602
2022-05-31(万方平台首次上网日期,不代表论文的发表时间)
共5页
68-72