10.16055/j.issn.1672-058X.2022.0005.008
一种基于HMM算法改进的语音识别系统
针对传统的HMM模型中状态持续时间不长的不足,且在计算量大的情况下,语音识别精度不高,训练时间长,训练误差较高,提出了一种基于语音状态持续时间长的HMM模型.首先,令状态转移矩阵的对角线元素全为0,去掉自转移弧,再增添以参数化的函数描述持续时间的高斯分布,再通过帧与帧相互之间的关联程度,将每帧都计算进去;其次,通过重估公式反复计算每条弧被指定的转变概率和可见符号序列输出最原始的数值概率,直至收敛,停止运算.最后,在HMM模型改进前后实验中得到更小的训练误差,下降速度更快,计算量较之前减少多,更容易达到收敛,其概率输出与它前面一个概率输出的差值与该概率输出值的比值大于HMM模型设定的初始值.与传统HMM模型实验比较,基于持续时间状态的HMM模型可以在一定程度上降低训练次数和训练时间,提高识别语音的精确度,基本完成了语音识别系统的功能.
语音识别、传统HMM模型、状态持续时间的HMM
39
TP183(自动化基础理论)
国家自然科学基金61971004
2022-11-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
56-61