基于梯度提升决策树的病理语音识别
病理语音是患者神经系统受损导致发音运动不协调所产生的语音.现有病理语音分析方法大多数采用频域语音特征如梅尔倒谱系数,并且识别模型也大多采用支持向量机模型.因此,提出一种时频特征短时傅里叶变换系数与梯度提升决策树的病理语音识别模型.首先,使用自建的脑卒中构音障碍数据集,提取语音的时频特征短时傅里叶变换系数.随后,结合梯度提升决策树算法进行分类识别.实验结果表明,提出的声学特征能够胜任脑卒中构音障碍识别任务.与梯度提升决策树分类器结合后,音节级别的准确率为68.5%,上升到说话人级别后准确率达到88.2%.
梯度提升决策树;构音障碍识别;时频特征
17
TN912.34
广东省重点领域研发计划2018B010115002
2022-03-03(万方平台首次上网日期,不代表论文的发表时间)
共3页
131-133