10.3979/j.issn.1673-825X.2016.02.006
Mel频率下基于LPC的语音信号深度特征提取算法
针对传统语音信号二次特征提取方法在保证识别率的前提下,实时性较差的问题,提出一种Mel频率下基于线性预测系数(linear predictive coefficient,LPC)的改进的语音信号深度特征提取算法.该方法根据人耳的听觉特性把LPC在Mel频率下进行非线性变换,再进行微分、高阶微分和按比例重组等步骤,得到一种既考虑声道激励又兼顾人耳听觉的新特征参数,从而大大减少传统语音信号深度特征提取的计算量,在不影响识别效率的情况下,极大提高系统的实时性.最后,将该算法在智能轮椅平台进行有效性验证,大量实验表明,语音控制系统实时性差的问题在使用该算法后能够得到明显改善,该算法既保证了特征提取识别率,也有效地改善了系统的实时性.在一定程度上使语音控制智能轮椅更具实用性.
语音识别、线性预测系数、Mel频率倒谱系数、Mel-LPC算法、深度特征提取
28
TN912.3;TP311
重庆市自然科学基金重点项目CSTC2015jcyjB0241;重庆市教委科技项目KJ13051The Key Science and Tchnology Project of CQ CSTCCSTC2015jcyjB0241;The Scientific and Technology Research Project of Chongqing Municipal Education CommissionKJ13051
2016-06-02(万方平台首次上网日期,不代表论文的发表时间)
共6页
174-179