10.16157/j.issn.0258-7998.212404
面向多说话人分离的深度学习麦克风阵列语音增强
随着近年来人机语音交互场景不断增加,利用麦克风阵列语音增强提高语音质量成为研究热点之一.与环境噪声不同,多说话人分离场景下干扰说话人语音与 目标说话人同为语音信号,呈现类似的时、频特性,对传统麦克风阵列语音增强技术提出更高的挑战.针对多说话人分离场景,基于深度学习网络构建麦阵空间响应代价函数并进行优化,通过深度学习模型训练设计麦克风阵列期望空间传输特性,从而通过改善波束指向性能提高分离效果.仿真和实验结果表明,该方法有效提高了多说话人分离性能.
深度学习、麦克风阵列、波束形成、LSTM
48
TN912.3
国家自然科学基金;深圳虚拟大学园扶持经费研发机构建设项目
2022-06-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
31-36