DOI：10.3969/j.issn.1000-3428.2015.10.050

基于高斯混合模型的感知域音频编码方法

引用

摘要：

传统感知音频编码方案采用心理声学掩蔽降低编码码率,其声道模型+信号激励的方式难以同时实现高质量的中低码率语音和音频信号编码.为此,提出一种基于高斯混合模型的感知域音频编码方法,利用Gammatone滤波器组模拟人耳听觉系统,采用多路复用掩蔽模型替换降低包络脉冲的数量,对结构化模型进行拟合,使用高斯-牛顿算法对听觉包络进行高斯混合模型参数的拟合,将高斯混合模型参数替代音频信号特征.实验结果表明,与基于稀疏包络表示重构的音频编码方法相比,该方法的主观测试高0.5分～0.8分,客观测试高5分～10分,解码得到的语音和大部分音乐信号都能还原到原始音频信号,可用于实现高质量的中低码率语音和音频编码.

关键词：人耳听觉系统、感知域音频编码、高斯混合模型、Gammatone滤波器组、高斯-牛顿算法

所属期刊栏目：41

分类号：TN912

资助基金：国家自然科学基金资助项目614712710

在线出版日期：2015-12-14（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：265-269

英文信息展示

期刊专题