10.3969/j.issn.1000-1220.2020.12.035
加权全序列卷积神经网络方法的帕金森声纹识别研究
帕金森患者由于无法稳定控制发声器官,导致声纹与健康人有所不同,使得利用声纹识别进行帕金森疾病检测成为可能.本文提出一种动态帧双门限端点检测方法,通过将帧能量升序排列进行阈值设定,实现静音区的剔除,解决准确捕捉有效音频区域问题;将小波变换融入提取过程,改进滤波器结构,更好拟合非平稳的音频信号,保留高频中的细节特征,获得高频梅尔频率倒谱小波系数(HMFCWC)特征,充分获取音频中有效信息;设计加权全序列卷积神经网络(Weighted Deep Fully Convolu-tional Necural Network,W-DFCNN),通过引入特征加权层,有效区分两类人群的特征进行加权并分类,在Sakar数据集上进行了实验验证,结果表明该方案识别确率达95.1%,优于其他传统分类方法,为帕金森疾病的声纹检测提供了可靠参考.
帕金森疾病、动态帧双门限端点检测、HMFCWC、W-DFCNN、声纹识别
41
TN912
国家自然科学基金项目61673259
2020-12-15(万方平台首次上网日期,不代表论文的发表时间)
共6页
2683-2688