一种3D音频中水平方位参数量化方法
本发明提出一种3D音频中水平方位参数量化方法,考虑了人耳在不同频带的感知能力,引入了人耳可感知的最小差异JND值;在量化客观失真的基础上,将其与JND值进行结合运算得到主观感知失真,以此为依据选出最符合人耳感知特性的码字作为量化结果。利用这种技术方案进行量化,量化结果的人耳主观感知性能较好。
发明专利
CN201210256992.5
2012-07-24
CN102760442A
2012-10-31
G10L19/00(2006.01)I
武汉大学
胡瑞敏;王晓晨;刘梦颖;冯云杰;章佩;杨姗姗;涂卫平;杨玉红;李登实
430072 湖北省武汉市武昌区珞珈山武汉大学
武汉科皓知识产权代理事务所(特殊普通合伙) 42222
严彦
湖北;42
一种3D音频中水平方位参数量化方法,其特征在于,包括以下步骤:步骤1.1、设3D音频的子带总数为N,输入N个子带的水平方位参数x1,x2,…,xN,通过查表得到对应的JND值jnd1,jnd2,…,jndN;步骤1.2、按照预设的维数k,划分得到多个k维的水平方位参数矢量[(x1,x2,…,xk)(xk+1,xk+2,…,x2k)…(xN?k+1,xN?k+2,…,xN)],根据划分结果生成相应的码本;同时将对应的JND值划分成多个k维矢量[(jnd1,jnd2,…,jndk)(jndk+1,jndk+2,…,jnd2k)…(jndN?k+1,jndN?k+2,…,jndN)];步骤1.3、对每个水平方位参数矢量(xi+1,xi+2,…,xi+k)进行量化,得到k维码字矢量(yi+1,yi+2,…,yi+k),i的取值为1,k+1…N?k+1;实现方式为,对每个水平方位参数矢量(xi+1,xi+2,…,xi+k)执行以下子步骤,步骤1.3.1、从码本中按顺序读入一个码字,将读入的码字作为k维码字矢量(yi+1,yi+2,…,yi+k)的当前量化结果;步骤1.3.2、根据1.3.1所得k维码字矢量(yi+1,yi+2,…,yi+k)的当前量化结果和步骤1.2所得相应的k维矢量(jndi+1,jndi+2,…,jndi+k)计算量化的主观感知失真步骤1.3.3、返回步骤1.3.1从码本中按顺序读入下一个码字并作为k维码字矢量(yi+1,yi+2,…,yi+k)的当前量化结果,直到遍历完码本中的码字,然后根据每次执行步骤1.3.2的结果选择其中主观感知失真Dsp的值最小的相应码字作为k维码字矢量(yi+1,yi+2,…,yi+k)的最终量化结果;步骤1.4、根据步骤1.3.3所得k维码字矢量[(y1,y2,…,yk)(yk+1,yk+2,…,y2k)…(yN?k+1,yN?k+2,…,yN)]的最终量化结果,输出N个子带的量化水平方位参数{y1,y2,…,yN}以及相应索引值Index1,Index2,…,IndexN,将索引值输出至码流。FDA00001925185300011.jpg