基于多延迟四阶累积量倍频程谱线的腭裂语音咽擦音自动检测算法
为了实现对腭裂语音咽擦音及正常音节的自动分类检测,通过对腭裂咽擦患者发音特点的研究,提出了基于多延迟四阶累积量倍频程谱线(Fourth-order Cumulant One-third Octave Spectra Line,FTSL)的腭裂语音咽擦音自动检测算法.目前,咽擦音的研究多基于咽擦音的辅音时长及其在频域的能量分布等特征,实现了咽擦音及正常擦音自动检测的其他研究较少.文中实验基于腭裂语音咽擦音的发音特性,通过研究语音信号的多延迟四阶累计量,利用1/3倍频程算法提取特征谱线,实现了腭裂语音咽擦音与正常擦音的自动分类检测.实验提取了200个正常擦音辅音和194个腭裂语音咽擦音辅音的FTSL特征谱线,使用SVM(Support Vector Machine)分类器进行分类,并设计了FTSL谱线与其他传统语音特征的对比实验,进行了充分的分析讨论.实验结果表明,FTSL谱线对咽擦音的自动分类检测正确率高达92.7%,具有较优的性能,能为临床腭咽功能评估提供有效、客观、无创的辅助依据.
咽擦音、FTSL谱线、四阶累积量、1/3倍频程谱线
47
TP391.9(计算技术、计算机技术)
国家自然基金青年科学基金61503264
2020-03-26(万方平台首次上网日期,不代表论文的发表时间)
共9页
144-152