低信噪比条件下深度学习麦克风阵列波束形成
随着智能装备、可穿戴设备、智能家居、远程会议等语音交互领域对语音质量要求的不断提高,麦克风阵列被广泛用于前端语音增强,但低信噪比场景对传统麦阵增强方法造成了极大挑战.采用时频掩蔽深度学习麦阵算法,可利用语音和噪声频谱、通道间相位差特征估计掩蔽值实现增强,但其在低信噪比条件下性能无法保证.与声学模型联合训练的深度学习麦克风阵列算法,可以利用声学模型词错误率(word error rate,WER)等识别端反馈,以提高低信噪比条件下的识别性能,但该类方法无需重构信号,不输出增强语音信号,不适合远程会议、通话终端等需增强语音输出的应用.针对低信噪比条件,设计了一种基于空域代价函数的麦克风阵列波束形成深度学习网络,提高了低信噪比下的语音质量,并通过仿真和实验证明了该方法的有效性.
波束形成、麦克风阵列、长短期记忆人工神经网络
43
TN929.3
国家自然科学基金;福建省自然科学基金计划项目;深圳虚拟大学园扶持经费研发机构建设项目
2023-01-05(万方平台首次上网日期,不代表论文的发表时间)
共6页
273-277,296