混音方法、装置及电子设备

引用

摘要：

本申请涉及音频处理技术领域，具体涉及一种混音方法、混音装置、计算机可读介质以及电子设备。该混音方法包括：获取至少两路音频输入信号，并分别获取每路音频输入信号的功率信息；获取与所述音频输入信号的频率相关的响度信息，并根据所述响度信息分别对所述音频输入信号中对应于各个频点的功率信息进行加权处理以得到所述音频输入信号的感知量化信息；分别对各路音频输入信号的感知量化信息进行数值调整以确定用于缩小各路音频输入信号之间的感知差异的感知均衡权重；根据各路音频输入信号的感知均衡权重对所述至少两路音频输入信号进行叠加处理以得到混合音频。可以通过调节感知均衡权重的方式对其混音后的真实感知效果做出调整，从而让所有通道的声音在混音后都尽可能地不被完全掩蔽，提高各路音频信号的可感知性。

专利类型：发明专利

申请/专利号：CN202010621654.1

申请日期：2020-06-30

公开/公告号：CN112750444A

公开/公告日：2021-05-04

主分类号：G10L21/007(2013.01)

申请/专利权人:腾讯科技(深圳)有限公司

发明/设计人:梁俊斌

主申请人地址:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层

专利代理机构:深圳市隆天联鼎知识产权代理有限公司

代理人:叶虹

国别省市代码:广东;44

权利要求：

1.一种混音方法，其特征在于，包括：获取至少两路音频输入信号，并分别获取每路音频输入信号的功率信息；获取与所述音频输入信号的频率相关的响度信息，并根据所述响度信息分别对所述音频输入信号中对应于各个频点的功率信息进行加权求和以得到所述音频输入信号的感知量化信息；分别对各路音频输入信号的感知量化信息进行数值调整以确定用于缩小各路音频输入信号之间的感知差异的感知均衡权重；根据各路音频输入信号的感知均衡权重对所述至少两路音频输入信号进行叠加处理以得到混合音频。 2.根据权利要求1所述的混音方法，其特征在于，所述分别获取每路音频输入信号的功率信息，包括：分别对每路音频输入信号进行分帧处理以得到所述音频输入信号的音频数据帧；对所述音频数据帧进行加窗处理以得到所述音频输入信号的加窗分帧信号；将所述加窗分帧信号由时间域转换至频率域以得到所述音频输入信号的功率信息。 3.根据权利要求2所述的混音方法，其特征在于，所述对所述音频数据帧进行加窗处理以得到所述音频输入信号的加窗分帧信号，包括：获取用于对所述音频数据帧进行加窗处理的窗函数，所述窗函数为汉明窗或者汉宁窗；将所述窗函数与所述音频数据帧点乘得到所述音频输入信号的加窗分帧信号。 4.根据权利要求2所述的混音方法，其特征在于，所述将所述加窗分帧信号由时间域转换至频率域以得到所述音频输入信号的功率信息，包括：对基于时间域的所述加窗分帧信号进行傅里叶变换以得到基于频率域的频谱信息；根据所述频谱信息中的幅值确定所述音频输入信号的能量谱信息；获取所述加窗分帧信号的分帧时间长度，并根据所述能量谱信息和所述分帧时间长度确定所述音频输入信号的功率信息。 5.根据权利要求2所述的混音方法，其特征在于，所述将所述加窗分帧信号由时间域转换至频率域以得到所述音频输入信号的功率信息，包括：获取所述加窗分帧信息在时间域上的自相关函数；对所述自相关函数进行傅里叶变换以得到基于频率域的所述音频输入信号的功率信息。 6.根据权利要求1所述的混音方法，其特征在于，所述获取与所述音频输入信号的频率相关的响度信息，包括：获取用于表示声压级与频率之间的映射关系的等响曲线数据；对所述等响曲线数据进行插值处理以得到与所述音频输入信号的频率相关的响度信息。 7.根据权利要求6所述的混音方法，其特征在于，所述对所述等响曲线数据进行插值处理以得到与所述音频输入信号的频率相关的响度信息，包括：在所述等响曲线数据中确定与所述音频输入信号的频率相邻的下频点和上频点；查询所述等响曲线数据以得到所述下频点和所述上频点的基准频率参数和基准声压参数；分别对所述基准频率参数和基准声压参数进行插值处理以得到与所述音频输入信号的频率相关的插值频率参数和插值声压参数；根据所述插值频率参数和所述插值声压参数确定与所述音频输入信号的频率相关的响度信息。 8.根据权利要求1所述的混音方法，其特征在于，所述根据所述响度信息分别对所述音频输入信号中对应于各个频点的功率信息进行加权求和以得到所述音频输入信号的感知量化信息，包括：对所述响度信息进行指数化处理以得到所述音频输入信号的感知加权系数；将所述感知加权系数与所述音频输入信号中对应于各个频点的功率信息进行加权求和以得到所述音频输入信号的感知量化信息。 9.根据权利要求1所述的混音方法，其特征在于，所述分别对各路音频输入信号的感知量化信息进行数值调整以确定用于缩小各路音频输入信号之间的感知差异的感知均衡权重，包括：对所述感知量化信息进行平滑滤波以得到所述音频输入信号的感知平滑值；比较各路音频输入信号的感知平滑值以得到最大平滑值，并确定所述最大平滑值与各个感知平滑值之间的感知平滑比例；对所述感知平滑比例进行平滑滤波以得到用于缩小各路音频输入信号之间的感知差异的感知均衡权重。 10.根据权利要求9所述的混音方法，其特征在于，所述对所述感知量化信息进行平滑滤波以得到所述音频输入信号的感知平滑值，包括：获取所述音频输入信号中前一信号帧的感知平滑值和当前信号帧的感知量化信息；获取用于对所述感知量化信息进行平滑滤波的第一平滑因子；根据所述第一平滑因子对所述前一信号帧的感知平滑值和所述当前信号帧的感知量化信息进行加权求和以得到当前信号帧的感知平滑值。 11.根据权利要求9所述的混音方法，其特征在于，所述对所述感知平滑比例进行平滑滤波以得到用于缩小各个所述音频输入信号之间的感知差异的感知均衡权重，包括：获取所述音频输入信号中前一信号帧的感知均衡权重和当前信号帧的感知平滑比例；获取用于对所述感知平滑比例进行平滑滤波的第二平滑因子；根据所述第二平滑因子对所述前一信号帧的感知均衡权重和所述当前信号帧的感知平滑比例进行加权求和以得到当前信号帧的感知均衡权重。 12.根据权利要求1所述的混音方法，其特征在于，所述根据各路音频输入信号的感知均衡权重对所述至少两路音频输入信号进行叠加处理以得到混合音频，包括：根据所述感知均衡权重对所述音频输入信号的功率信息进行加权处理以得到所述音频输入信号的均衡功率信息；将所述均衡功率信息由频率域转换至时间域以得到所述音频输入信号的均衡音频信号；对所述至少两路音频输入信号的均衡音频信号进行叠加处理以得到混合音频。 13.根据权利要求12所述的混音方法，其特征在于，所述对所述至少两路音频输入信号的均衡音频信号进行叠加处理以得到混合音频，包括：对所述至少两路音频输入信号的均衡音频信号进行线性叠加以得到线性叠加信号；获取用于确定混合音频的信号值域的值域量化因子和用于将所述混合音频收缩至所述信号值域的基本收缩因子；根据所述值域量化因子和所述基本收缩因子对所述线性叠加信号进行收缩混音以得到混合音频。 14.一种混音装置，其特征在于，包括：功率获取模块，被配置为获取至少两路音频输入信号，并分别获取每路音频输入信号的功率信息；感知量化模块，被配置为获取与所述音频输入信号的频率相关的响度信息，并根据所述响度信息分别对所述音频输入信号中对应于各个频点的功率信息进行加权求和以得到所述音频输入信号的感知量化信息；感知均衡模块，被配置为分别对各路音频输入信号的感知量化信息进行数值调整以确定用于缩小各路音频输入信号之间的感知差异的感知均衡权重；信号叠加模块，被配置为根据各路音频输入信号的感知均衡权重对所述至少两路音频输入信号进行叠加处理以得到混合音频。 15.一种电子设备，其特征在于，包括：处理器；以及存储器，用于存储所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1至13中任意一项所述的混音方法。

专利专题