10.16798/j.issn.1003-0530.2021.10.001
基于瞬时相位差和深度学习的丢包隐藏方法
实时IP语音通信在数据包会丢失的情况下,语音质量会受到严重影响.为了恢复传输过程中丢失的语音信息,本文提出了一种基于瞬时相位差(Instantaneous Phase Deviation,IPD)和深度神经网络(Deep Neural Network,DNN)的丢包隐藏(Packet Loss Concealment,PLC)方法.在训练阶段,将语音的对数功率谱(Log Power Spectrum,LPS)和IPD作为训练DNN的输入特征,以学习从接收包到丢失包的映射关系;在重构阶段,将丢包前接收到的语音包送入训练好的DNN中,恢复出丢失包的语音.实验结果表明,在不同丢包率下,所提方法的性能优于传统的基于LPS和DNN的PLC方法.
深度神经网络;相位特征;丢包隐藏
37
TN912.3
2021-12-10(万方平台首次上网日期,不代表论文的发表时间)
共8页
1791-1798