一种3D音频中水平方位参数量化方法

引用

摘要：

本发明提出一种3D音频中水平方位参数量化方法，考虑了人耳在不同频带的感知能力，引入了人耳可感知的最小差异JND值；在量化客观失真的基础上，将其与JND值进行结合运算得到主观感知失真，以此为依据选出最符合人耳感知特性的码字作为量化结果。利用这种技术方案进行量化，量化结果的人耳主观感知性能较好。

专利类型：发明专利

申请/专利号：CN201210256992.5

申请日期：2012-07-24

公开/公告号：CN102760442A

公开/公告日：2012-10-31

主分类号：G10L19/00(2006.01)I

申请/专利权人:武汉大学

发明/设计人:胡瑞敏;王晓晨;刘梦颖;冯云杰;章佩;杨姗姗;涂卫平;杨玉红;李登实

主申请人地址:430072 湖北省武汉市武昌区珞珈山武汉大学

专利代理机构:武汉科皓知识产权代理事务所(特殊普通合伙) 42222

代理人:严彦

国别省市代码:湖北;42

权利要求：

一种3D音频中水平方位参数量化方法，其特征在于，包括以下步骤：步骤1.1、设3D音频的子带总数为N，输入N个子带的水平方位参数x1,x2,…,xN，通过查表得到对应的JND值jnd1,jnd2,…,jndN；步骤1.2、按照预设的维数k，划分得到多个k维的水平方位参数矢量[(x1,x2,…,xk)(xk+1，xk+2,…,x2k)…(xN?k+1,xN?k+2，…,xN)]，根据划分结果生成相应的码本；同时将对应的JND值划分成多个k维矢量[(jnd1,jnd2,…,jndk)(jndk+1，jndk+2，…,jnd2k)…(jndN?k+1,jndN?k+2，…,jndN)]；步骤1.3、对每个水平方位参数矢量(xi+1，xi+2,…,xi+k)进行量化，得到k维码字矢量(yi+1，yi+2,…,yi+k)，i的取值为1,k+1…N?k+1；实现方式为，对每个水平方位参数矢量(xi+1,xi+2,…,xi+k)执行以下子步骤，步骤1.3.1、从码本中按顺序读入一个码字，将读入的码字作为k维码字矢量(yi+1，yi+2,…,yi+k)的当前量化结果；步骤1.3.2、根据1.3.1所得k维码字矢量(yi+1，yi+2,…,yi+k)的当前量化结果和步骤1.2所得相应的k维矢量(jndi+1，jndi+2，…,jndi+k)计算量化的主观感知失真步骤1.3.3、返回步骤1.3.1从码本中按顺序读入下一个码字并作为k维码字矢量(yi+1，yi+2,…,yi+k)的当前量化结果，直到遍历完码本中的码字，然后根据每次执行步骤1.3.2的结果选择其中主观感知失真Dsp的值最小的相应码字作为k维码字矢量(yi+1，yi+2,…,yi+k)的最终量化结果；步骤1.4、根据步骤1.3.3所得k维码字矢量[(y1,y2,…,yk)(yk+1，yk+2,…,y2k)…(yN?k+1,yN?k+2，…,yN)]的最终量化结果，输出N个子带的量化水平方位参数{y1,y2,…,yN}以及相应索引值Index1,Index2,…,IndexN，将索引值输出至码流。FDA00001925185300011.jpg

专利专题