一种MP3压缩域音频分割方法
本发明涉及一种MP3压缩域音频分割方法。本方法先从MP3压缩音频数据中提取特征参数,再将音频信息进行静音分割,对非静音语音分割,在语音段中用统计判决模型进行说话人改变检测,最后由说话人改变点的得到分割结果。实验结果,采用本发明得分割方法比传统分割方法,在其准确率、召回率和综合性能均有显著提高。
发明专利
CN200710171802.9
2007-12-06
CN101221762
2008-07-16
G10L17/00(2006.01)I
上海大学
余小清;万旺根;常辽豫;谭海英
200444上海市宝山区上大路99号
上海上大专利事务所
何文欣
上海;31
1、一种MP3压缩域音频分割方法,其特征在于:首先从MPEG1标准声音第三层压缩技术MP3文件中得到体现原始音频频域特性的数据,其次对这些数据计算能量和频域特征参数,然后使用这些参数去除静音部分并检测出语音;最后在语音片段间检测话者的改变,由此得到最终分割结果。