10.16451/j.cnki.issn1003-6059.201512005
基于深度神经网络的语种识别
语音段的有效表示方法存在易混淆语种和短时语音段识别率较低等问题,为满足不同时长和方言的识别要求,提出基于深度神经网络不同层的有效语音段表示方法.采用含有中间瓶颈层的深层神经网络作为前端特征提取,综合利用该网络的输出层和中间瓶颈层输出结果,得到不同形式的语音段表示并用于语种识别.在美国国家标准技术局语种识别评测2009年和2011年阿拉伯方言数据集上验证了方法的有效性.
语种识别、深度神经网络、语音段表示、深度瓶颈特征
28
TN912.34
国家自然科学基金项目61172158
2016-04-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
1093-1099