基于改进声调核模型的汉语语音声调识别方法

引用

摘要：

本发明提出了一种可以提高4种声调平均识别率的方法，该方法为：提出了一种改进的声调核模型；设计了一种自适应提取孤立音节基频曲线声调核的算法，该算法首先移除首尾部分的野值段，然后对经过Viterbi分割及T假设检验合并后的分段结果进行声调核决策，得到声调核。设计了三组利用不同方法进行声调识别的实验，实验A提取整个音节的声学特征进行声调识别，实验B基于传统声调核模型提取声调核的声学特征进行声调识别，实验C利用改进的声调核模型自适应提取声调核的声学特征进行声调识别。实验结果表明利用基于改进的声调核模型提取的声调核进行声调识别可以提高4种声调的平均识别率。

专利类型：发明专利

申请/专利号：CN201310185819.5

申请日期：2013-05-20

公开/公告号：CN103325372A

公开/公告日：2013-09-25

主分类号：G10L17/16(2013.01)I

申请/专利权人:北京航空航天大学

发明/设计人:毛峡;魏鹏飞

主申请人地址:100191 北京市海淀区学院路37号

国别省市代码:北京;11

权利要求：

本发明提出了一种改进的声调核模型，将孤立音节的基频曲线划分为起始野值段，起始过渡段，声调核，末尾过渡段，末尾野值段五部分；其中起始野值段与末尾野值段属于基频野值，是由于音节分割无法100%准确分离有音部分与无音部分而产生的随机分布的基频值；起始过渡段与末尾过渡段是由复杂的喉部机械生理结构而导致的基频曲线波动，对声调的听辨不起作用；声调核是决定声调类型的关键部分，最能体现声调基频变化的趋势。

专利专题