DOI：10.3969/j.issn.1001-5965.2001.02.006

汉语语音识别的平滑声韵基元HMM算法

引用

摘要：

汉语语音识别的基本单元一般为音素、音节以及声韵母.以声韵母为基元的识别系统由于HMM模型较少，计算量小，适合于实时实现.但是由于模型比较孤立，对语音信号的声学特性描述得不够精确，因而识别率一般比音节基元的系统低.而以音节、音素（tri-phone、di-phone）为基元的系统则有HMM模型数量多、训练和识别过程中计算量大的缺点，影响到系统的实时性.本文提出了一种折衷的方案，系统基元仍选择声韵母，而在HMM训练阶段，对整个音节序列的参数进行运算，使声韵过渡段的状态得到平滑，同时计算并保存每个音节声韵之间的转移概率，识别时动态组装为完整的音节HMM.该方法在保持少量HMM个数的同时，能够降低误试率，适合于以DSP为核心的实时连接词语音识别系统.

关键词：言语识别、实时、马尔柯夫过程、HMM、声韵基元、平滑

所属期刊栏目：27

分类号：TN912.3

资助基金：广东省自然科学基金960631

在线出版日期：2004-01-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：146-149

英文信息展示

期刊专题