一种MP3压缩域音频分割方法

引用

摘要：

本发明涉及一种MP3压缩域音频分割方法。本方法先从MP3压缩音频数据中提取特征参数，再将音频信息进行静音分割，对非静音语音分割，在语音段中用统计判决模型进行说话人改变检测，最后由说话人改变点的得到分割结果。实验结果，采用本发明得分割方法比传统分割方法，在其准确率、召回率和综合性能均有显著提高。

专利类型：发明专利

申请/专利号：CN200710171802.9

申请日期：2007-12-06

公开/公告号：CN101221762

公开/公告日：2008-07-16

主分类号：G10L17/00(2006.01)I

申请/专利权人:上海大学

发明/设计人:余小清;万旺根;常辽豫;谭海英

主申请人地址:200444上海市宝山区上大路99号

专利代理机构:上海上大专利事务所

代理人:何文欣

国别省市代码:上海;31

权利要求：

1、一种MP3压缩域音频分割方法，其特征在于：首先从MPEG1标准声音第三层压缩技术MP3文件中得到体现原始音频频域特性的数据，其次对这些数据计算能量和频域特征参数，然后使用这些参数去除静音部分并检测出语音；最后在语音片段间检测话者的改变，由此得到最终分割结果。

专利专题