用于对多声道信号进行编码或解码的装置与方法

引用

摘要：

实施例提供了一种对具有至少三个声道的多声道信号进行编码的装置。该装置包括迭代处理器、声道编码器和输出接口。迭代处理器被配置为在第一迭代步骤中计算至少三个声道中的每对之间的声道间相关值，选择具有最高值或具有高于阈值的值的对，并且使用多声道处理操作处理所选择的对，以导出针对所选择的对的第一多声道参数并导出第一处理声道。迭代处理器被配置为在第二迭代步骤中通过使用处理声道的至少一个而执行所述计算、所述选择和所述处理，以导出第二多声道参数和第二处理声道。声道编码器被配置为对根据迭代处理得到的声道进行编码以获得编码声道。输出接口被配置为产生具有编码声道以及第一多声道参数和第二多声道参数的编码多声道信号。

专利类型：发明专利

申请/专利号：CN202011242898.5

申请日期：2016-03-08

公开/公告号：CN112233684A

公开/公告日：2021-01-15

主分类号：G10L19/02(2013.01)

申请/专利权人:弗劳恩霍夫应用研究促进协会

发明/设计人:萨沙·迪克;弗洛里安·舒;尼古拉斯·里特尔博谢;托比亚斯·施威格勒;理查德·福格;约翰内斯·希尔珀特;马蒂亚斯·诺伊辛格

主申请人地址:德国慕尼黑

专利代理机构:中科专利商标代理有限责任公司

代理人:潘剑颖

国别省市代码:德国;DE

权利要求：

1.一种用于对具有至少三个声道(CH1至CH3)的多声道信号(101)进行编码的装置(100)，包括：迭代处理器(102)，用于在第一迭代步骤中计算所述至少三个声道(CH1至CH3)中的每对之间的声道间相关值，在第一迭代步骤中选择具有最高值或具有高于阈值的值的对，以及使用多声道处理操作(110、112)处理所选择的对，以导出针对所选择的对的第一多声道参数(MCH_PAR1)并导出第一处理声道(P1、P2)，其中，所述迭代处理器(102)被配置为在第二迭代步骤中使用处理声道(P1)中的至少一个执行所述计算、所述选择和所述处理，以导出第二多声道参数(MCH_PAR2)和第二处理声道(P3、P4)；声道编码器，用于对从根据所述迭代处理器(104)执行的迭代处理得到的声道(P2至P4)进行编码以获得编码声道(E1至E3)；以及输出接口(106)，用于产生具有所述编码声道(E1至E3)以及第一多声道参数和第二多声道参数(MCH_PAR1、MCH_PAR2)的编码多声道信号(107)。 2.根据权利要求1所述的装置(100)，其中，所述输出接口(106)被配置为将所述编码多声道信号(107)产生为串行比特流，使得第二多声道参数(MCH_PAR2)在所述编码信号中位于第一多声道参数(MCH_PAR1)之前。 3.根据权利要求1所述的装置(100)，其中，所述迭代处理器(102)被配置为执行包括包含以下各项的组中的至少一项在内的立体声处理：使用根据所选择的对的旋转角度计算的旋转处理以及预测处理。 4.根据权利要求1所述的装置(100)，其中，第一多声道参数(MCH_PAR1)包括在第一迭代步骤中所选择的对中的声道的第一标识，并且第二多声道参数(MCH_PAR2)包括在第二迭代步骤中所选择的对中的声道的第二标识。 5.根据权利要求1所述的装置(100)，其中，所述迭代处理器(102)被配置为使用包括多个频带的每个声道的帧计算声道间相关性，以便获得针对所述多个频带的单个声道间相关值，并且其中，所述迭代处理器(104)被配置为针对所述多个频带中的每个频带执行所述多声道处理，从而针对所述多个频带中的每个频带获得第一多声道参数或第二多声道参数(MCH_PAR1、MCH_PAR2)。 6.根据权利要求1所述的装置(100)，其中，所述迭代处理器(102)被配置为针对第一帧导出多个选择对指示，并且所述输出接口(106)被配置为针对第一帧之后的第二帧在所述多声道信号(107)中包括保持指示符，所述保持指示符指示第二帧与第一帧具有相同的多个选择对指示。 7.根据权利要求1所述的装置(100)，其中，所述迭代处理器(102)被配置为仅在对的电平差小于阈值时才选择所述对，所述阈值小于40dB或25dB或12dB，或者小于6dB。 8.根据权利要求1所述的装置(100)，其中，所述迭代处理器(102)被配置为计算归一化相关值，并且所述迭代处理器(102)被配置为在所述相关值大于0.2并且优选为0.3时选择对。 9.根据权利要求1所述的装置(100)，其中，所述迭代处理器(102)被配置为在所述多声道处理中计算立体声参数，并且所述迭代处理器(102)被配置为仅在立体声参数高于由立体声参数量化器定义的量化到零阈值的频带中执行立体声处理。 10.根据权利要求1所述的装置(100)，其中，所述迭代处理器(102)被配置为在所述多声道处理中计算旋转角度，并且所述迭代处理器(102)被配置为仅在旋转角度高于解码器侧去量化到零阈值的频带中执行旋转处理。 11.根据权利要求1所述的装置(100)，其中，所述迭代处理器(102)被配置为在第二迭代步骤中不选择在第一迭代步骤中所选择的对，并且如果可行的话，在任何进一步的迭代步骤中也不选择该所选择的对。 12.根据权利要求1所述的装置(100)，其中，所述迭代处理器(102)被配置为执行迭代步骤直到达到迭代终止标准，其中，所述迭代终止标准是迭代步骤的最大数量等于所述多声道信号(101)的声道的总数量或比所述多声道信号(101)的声道的总数量大两个，或者所述迭代终止标准是当所述声道间相关值不具有大于所述阈值的值时。 13.根据权利要求1所述的装置(100)，其中，所述迭代处理器(102)被配置为在第一迭代步骤中使用所述多声道处理来处理所选择的对，使得所述处理声道(P1、P2)是中声道(P1)和侧声道(P2)；以及其中，所述迭代处理器(102)被配置为在第二迭代步骤中通过仅使用所述处理声道(P1、P2)的中声道(P1)作为所述处理声道(P1、P2)的所述至少一个来执行所述计算、所述选择和所述处理，以导出第二多声道参数(MCH_PAR2)与第二处理声道(P3、P4)。 14.根据权利要求1所述的装置(100)，其中，所述声道编码器包括用于对根据所述迭代处理得到的声道(P2至P4)进行编码的声道编码器(120_1至120_3)，其中，所述声道编码器被配置为对声道(P2至P4)进行编码，使得与对具有较多能量的声道进行编码相比，使用较少的比特来对具有较少能量的声道进行编码。 15.一种用于对具有编码声道(E1至E3)以及至少第一多声道参数和第二多声道参数(MCH_PAR1、MCH_PAR2)的编码多声道信号(107)进行解码的装置(200)，包括：声道解码器(202)，用于对所述编码声道(E1至E3)进行解码以获得解码声道(D1至D3)；以及多声道处理器(204)，用于使用通过第二多声道参数(MCH_PAR2)标识的解码声道(D1至D3)中的第二对并且使用第二多声道参数(MCH_PAR2)来执行多声道处理，以获得处理声道(P1*、P2*)，以及用于使用通过第一多声道参数(MCH_PAR1)标识的声道(D1至D3、P1*、P2*)中的第一对并且使用第一多声道参数(MCH_PAR1)来执行进一步的多声道处理，其中，声道的第一对包括至少一个处理声道(P1*、P2*)。 16.根据权利要求15所述的装置(200)，其中，所述编码多声道信号(107)包括针对第一帧的第一多声道参数和第二多声道参数(MCH_PAR1、MCH_PAR2)以及针对第一帧之后的第二帧的保持指示符，并且其中，所述多声道处理器(204)被配置为在第二帧中对与在第一帧中所使用的声道的第二对和第一对相同的第二对和第一对执行所述多声道处理和所述进一步的多声道处理。 17.根据权利要求15所述的装置(200)，其中，所述多声道处理和所述进一步的多声道处理包括使用立体声参数的立体声处理，其中，针对解码声道(D1至D3)的单独比例因子频带或比例因子频带组，第一立体声参数包括在第一多声道参数(MCH_PAR1)中并且第二立体声参数包括在第二多声道参数(MCH_PAR2)中。 18.根据权利要求15所述的装置(200)，其中，第一多声道参数或第二多声道参数(MCH_PAR1、MCH_PAR2)包括多声道处理掩码，所述多声道处理掩码指示哪些比例因子频带经过多声道处理以及哪些比例因子频带未经过多声道处理，并且其中，所述多声道处理器(204)被配置为在由所述多声道处理掩码指示的比例因子频带中不执行多声道处理。 19.根据权利要求15所述的装置(200)，其中，第一多声道参数和第二多声道参数(MCH_PAR1、MCH_PAR2)均包括声道对标识，并且其中，所述多声道处理器(204)被配置为通过使用预定义解码规则或在编码多声道信号中指示的解码规则对所述声道对标识进行解码。 20.根据权利要求19所述的装置(200)，其中，所述解码规则是霍夫曼解码规则，并且所述多声道处理器(204)被配置为对所述声道对标识执行霍夫曼解码。 21.根据权利要求15所述的装置(200)，其中，所述编码多声道信号(107)包括多声道处理允许指示符，所述多声道处理允许指示符仅指示解码声道的允许进行所述多声道处理的子组并且指示不允许进行所述多声道处理的至少一个解码声道，并且其中，所述多声道处理器(204)被配置为不对如所述多声道处理允许指示符所指示的那样不允许进行多声道处理的所述至少一个解码声道执行任何多声道处理。 22.根据权利要求15所述的装置(200)，其中，第一多声道参数和第二多声道参数(MCH_PAR1、MCH_PAR2)包括立体声参数，并且所述立体声参数被差分编码，并且所述多声道处理器(204)包括用于对经过差分编码的立体声参数进行差分解码的差分解码器。 23.根据权利要求15所述的装置，其中，所述编码多声道信号(107)是串行信号，其中，在解码器(200)处，第二多声道参数(MCH_PAR2)在第一多声道参数(MCH_PAR1)之前被接收，并且其中，所述多声道处理器(204)被配置为按照所述解码器(200)接收多声道参数(MCH_PAR1、MCH_PAR2)的顺序来处理所述解码声道(D1至D3)。 24.一种用于对具有至少三个声道的多声道信号进行编码的方法(300)，包括：在第一迭代步骤中计算(302)至少三个声道中的每对之间的声道间相关值，在第一迭代步骤中选择具有最高值或具有高于阈值的值的对，并且使用多声道处理操作处理所选择的对，以导出针对所选择的对的第一多声道参数并导出第一处理声道；在第二迭代步骤中使用所述处理声道中的至少一个来执行(304)所述计算、所述选择和所述处理，以导出第二多声道参数和第二处理声道；对根据由迭代处理器执行的迭代处理得到的声道进行编码(306)以获得编码声道；以及产生(308)具有编码声道以及第一多声道参数和第二多声道参数的编码多声道信号。 25.一种用于对具有编码声道以及至少第一多声道参数和第二多声道参数的编码多声道信号进行解码的方法(400)，包括：对编码声道进行解码(402)以获得解码声道；以及使用通过第二多声道参数标识的解码声道的第二对并且使用第二多声道参数来执行(404)多声道处理，以获得处理声道，以及使用由第一多声道参数标识的声道的第一对并且使用第一多声道参数来执行进一步的多声道处理，其中，声道的第一对包括至少一个处理声道。 26.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序用于当在计算机或处理器上运行时使所述计算机或处理器执行根据权利要求24所述的对多声道信号进行编码的方法或根据权利要求25所述的对编码多声道信号进行解码的方法。 27.根据权利要求1或15所述的装置、根据权利要求24或25所述的方法或根据权利要求26所述的计算机可读存储介质，其中，多声道处理意味着对多于两个声道进行联合立体声处理或联合处理，并且多声道信号具有两个声道或多于两个声道。

专利专题