一种单信道目标语音增强方法
本发明提供一种单信道目标语音增强方法,包括如下步骤:步骤一:语音信号的预处理与特征转换,引入时间潜在域信息,将时序波形信息通过深度学习框架拓展映射到对应潜在空间域的过程及其逆向变换;步骤二:基于生成信号权重的目标函数;步骤三:引入时序TCN网络模型;本发明网络能实现从混合源语音到目标语音信号的端到端处理,网络的增强性能优秀,能良好还原目标语音信号,同时提升了数据处理的并行处理能力,并能通过自身的数据增广丰富样本集,提升模型性能。
发明专利
CN202011376572.1
2020-11-30
CN112562707A
2021-03-26
G10L21/02(2013.01)
哈尔滨工程大学
关键;肖飞扬;柳友德;芦瑶;兰宇晨;田左;王恺瀚;谢明杰
150001 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室
黑龙江;23
1.一种单信道目标语音增强方法,其特征是,包括如下步骤: 步骤一:语音信号的预处理与特征转换: 引入时间潜在域信息,将时序波形信息通过深度学习框架拓展映射到对应潜在空间域的过程及其逆向变换; 步骤二:基于生成信号权重的目标函数; 其中的xc指代作为条件约束的混合源单信道语音信号; 步骤三:引入时序TCN网络模型; 时序TCN模型的输入为经过处理后的语音特征信息,借助对抗式训练的强大泛化能力,对纯净的目标语音信号进行了预测评估,生成器模型参考时序TCN模型的评估结果,对混合源单信道语音信号加以掩码,转换为对目标语音信号的拟合,实现了对混合源单信道语音信号的端到端增强处理。