DOI：10.3969/j.issn.1000-3428.2011.22.089

基于发音特征的音视频融合语音识别模型

引用

摘要：

构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AFAV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步.在音视频语音数据库上的语音识别实验表明,通过调整发音特征之问的异步约束,AF- AV_DBN模型能得到比基于状态的同步和异步DBN模型以及音频单流模型更高的识别率,对噪声也具有较好的鲁棒性.

关键词：动态贝叶斯网络、发音特征、音视频融合、语音识别、异步

所属期刊栏目：37

分类号：TP391.42(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目60703104;陕西省自然科学基金资助项目SJ08F28;西北工业大学基础研究基金资助项目JC200943

在线出版日期：2012-03-16（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：268-269,272

英文信息展示

期刊专题