DOI：10.3969/j.issn.1000-1220.2020.12.035

加权全序列卷积神经网络方法的帕金森声纹识别研究

引用

摘要：

帕金森患者由于无法稳定控制发声器官,导致声纹与健康人有所不同,使得利用声纹识别进行帕金森疾病检测成为可能.本文提出一种动态帧双门限端点检测方法,通过将帧能量升序排列进行阈值设定,实现静音区的剔除,解决准确捕捉有效音频区域问题;将小波变换融入提取过程,改进滤波器结构,更好拟合非平稳的音频信号,保留高频中的细节特征,获得高频梅尔频率倒谱小波系数(HMFCWC)特征,充分获取音频中有效信息;设计加权全序列卷积神经网络(Weighted Deep Fully Convolu-tional Necural Network,W-DFCNN),通过引入特征加权层,有效区分两类人群的特征进行加权并分类,在Sakar数据集上进行了实验验证,结果表明该方案识别确率达95.1％,优于其他传统分类方法,为帕金森疾病的声纹检测提供了可靠参考.

关键词：帕金森疾病、动态帧双门限端点检测、HMFCWC、W-DFCNN、声纹识别

所属期刊栏目：41

分类号：TN912

资助基金：国家自然科学基金项目61673259

在线出版日期：2020-12-15（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：2683-2688

英文信息展示

期刊专题