面向多说话人分离的深度学习麦克风阵列语音增强

引用

摘要：

随着近年来人机语音交互场景不断增加,利用麦克风阵列语音增强提高语音质量成为研究热点之一.与环境噪声不同,多说话人分离场景下干扰说话人语音与目标说话人同为语音信号,呈现类似的时、频特性,对传统麦克风阵列语音增强技术提出更高的挑战.针对多说话人分离场景,基于深度学习网络构建麦阵空间响应代价函数并进行优化,通过深度学习模型训练设计麦克风阵列期望空间传输特性,从而通过改善波束指向性能提高分离效果.仿真和实验结果表明,该方法有效提高了多说话人分离性能.

关键词：深度学习、麦克风阵列、波束形成、LSTM

所属期刊栏目：48

分类号：TN912.3

资助基金：国家自然科学基金;深圳虚拟大学园扶持经费研发机构建设项目

在线出版日期：2022-06-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：31-36

英文信息展示

期刊专题