DOI：10.3969/j.issn.1003-0530.2012.02.022

基于语速调整和音位属性后验概率的音素识别

引用

摘要：

基于语音事件检测的自动语音识别是当前研究的热点问题.针对说话人语速变化导致模型适应性差的问题,提出了一种语速自适应调整算法.该算法以语句为单位,采用连续变化的帧长与帧移间隔对语句进行归一化调整,使调整后速率与语料库平均速率一致,减小速率因素对模型训练的影响；另外,通过计算音位属性的后验概率向量间夹角,得到测试集的语速,相比采用训练模型的语速检测方法减轻了系统负担.本文将语速调整算法应用于音位属性的提取,并对音位属性特征进行非线性变换,最后采用隐马尔科夫模型进行建模,实验表明:经过语速调整后,音素的平均持续帧数较为恒定,动态变化范围减小,使得音素识别率提升了1.3％.

关键词：语速调整、音位属性检测、隐马尔可夫模型、自动语音识别

所属期刊栏目：28

分类号：TP391.4(计算技术、计算机技术)

资助基金：国家自然科学基金61175017

在线出版日期：2012-06-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：295-300

英文信息展示

期刊专题