10.3969/j.issn.1000-3428.2011.22.089
基于发音特征的音视频融合语音识别模型
构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AFAV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步.在音视频语音数据库上的语音识别实验表明,通过调整发音特征之问的异步约束,AF- AV_DBN模型能得到比基于状态的同步和异步DBN模型以及音频单流模型更高的识别率,对噪声也具有较好的鲁棒性.
动态贝叶斯网络、发音特征、音视频融合、语音识别、异步
37
TP391.42(计算技术、计算机技术)
国家自然科学基金资助项目60703104;陕西省自然科学基金资助项目SJ08F28;西北工业大学基础研究基金资助项目JC200943
2012-03-16(万方平台首次上网日期,不代表论文的发表时间)
共3页
268-269,272